Я вас сегодня вопросами замучаю :))

здесь можно обсудить кошечек и ёжиков
Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Я вас сегодня вопросами замучаю :))

Сообщение Serge » Пт окт 10, 2003 6:38 pm

Итак, еще один:
Предполагается написать ядро поискового скрипта а-ля Яндекс, только для химического сегмента Интернета. Для поиска будет производиться индексация сайтов из каталогов Химического портала.
Внимание, вопрос: какими функциями должен обладать такой скрипт на Ваш взгляд. Какую информацию он должен выдавать в результате поиска?
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
Satyros
Сообщения: 1934
Зарегистрирован: Чт мар 06, 2003 11:06 am

Сообщение Satyros » Пт окт 10, 2003 8:05 pm

Есть уже такая штука, Коперник называецца, встраваецца в строку браузера и у него там форма для поиска. Работает довольно беспонтово, поскольку русский язык не воспринимает практически вообще.
Те, кто уцелеют, расскажут, как всё было замечательно.

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8532
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Пт окт 10, 2003 8:39 pm

Какая штука? Коперник - это просто надстройка для метапоиска, разве нет? Я понимал вопрос иначе, а именно: как наладить поиск с использованием химической специфики искомой инфы? Тут так: никак, задача слишком огромна. Химичность скрипта предполагает поиск по брутто-формуле, SMILES-строке, структурной формуле в формате какой-нибудь из популярных рисовалок, параметрам ячейки, ещё какой-нибудь лабуде. Всё это сложно. И всё реализовано, но во-первых, порознь, а во-вторых, в дорогих коммерческих базах данных.

Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Сообщение Serge » Вт окт 14, 2003 5:12 pm

вопрос все еще актуален :)))
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Сообщение Serge » Вт окт 14, 2003 8:45 pm

up!
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
Lust
Сообщения: 607
Зарегистрирован: Вт сен 02, 2003 3:46 pm

Сообщение Lust » Вт окт 14, 2003 8:47 pm

Бесплатную базу ЯМР! :D

Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Сообщение Serge » Вт окт 14, 2003 8:49 pm

а это что такое? имеется в виду база спектров?
я ж серьезно спрашиваю..
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
Dima_K
Сообщения: 181
Зарегистрирован: Вт окт 14, 2003 3:28 am

Сообщение Dima_K » Вт окт 14, 2003 8:52 pm

Serge писал(а):а это что такое? имеется в виду база спектров?
я ж серьезно спрашиваю..
Ну конечно, со структурками и отнесением. Я где-то читал что химики подругому думают им рисуночки страсть как нужны. И занятия математикой им вредны, так же как и политологией и психологией с педагогикой. А военка - вообще смерть для химика. :?

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8532
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Вт окт 14, 2003 8:54 pm

Кем предполагается? Яндекс - штука совсем серьёзная. Один бог знает, как искать в инете файлы специальных химических форматов, распознавать их и сравнивать.
Как первый шаг к охимичиванию поискового скрипта, он должен парсить просто текст и выцеплять из него токены, которые похожи на химические названия или химические формулы. Эти складывать отдельно.

Аватара пользователя
Lust
Сообщения: 607
Зарегистрирован: Вт сен 02, 2003 3:46 pm

Сообщение Lust » Вт окт 14, 2003 8:55 pm

Ну в частности да, спектры бывают полезны...
Кстати, третьекурснички, радуйтесь: вот здесь можно быстро и бесплатно идентифицировать ваше соединение:
http://www.aist.go.jp/RIODB/SDBS/sdbs/o ... _frame_sea
Инструкция по пользованию проста: вводите все что известно, нажимаете Query и наслаждаетесь :) Есть 1Н и 13С спектры...
Если есть еще вопросы - пишите...

А на счет вопроса... Не знаю, может быть что-нибудь подобное тому, что сделано в E-library...?
Really, I don't know...
Последний раз редактировалось Lust Вт окт 14, 2003 9:29 pm, всего редактировалось 2 раза.

Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Сообщение Serge » Вт окт 14, 2003 8:55 pm

да мной предполагается... сам индексатор-робот уже готов, единственное, что flash он не обрабатывает... а дальше нужно его "охимичить" :))
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8532
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Вт окт 14, 2003 9:18 pm

Тогда то, что я сказал, актуально. Обычное слово ищется среди множества обычных слов. Хим. формула ищется среди множества найденных формул и т.д.
Что значит не обрабатывает flash? Выкидывает просто нафиг? А что обрабатывает, кроме просто текста?

Аватара пользователя
Serge
автор
Сообщения: 5021
Зарегистрирован: Ср мар 05, 2003 12:57 pm
Контактная информация:

Сообщение Serge » Вт окт 14, 2003 9:23 pm

гм... от меня явно ждали чего-то сверхестественного :))))
он обрабатывае все форматы веба (страниц), кроме флеша, на предмет ссылок и текста.
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm

Аватара пользователя
Satyros
Сообщения: 1934
Зарегистрирован: Чт мар 06, 2003 11:06 am

Сообщение Satyros » Ср окт 15, 2003 7:35 am

Lust, оченно забавную сцылку ты прислал. Однако ж, насколько видно, те же ЯМР'ы ограничены там пятью пиками. Довольно жалобно. Отсюда вопрос к присутсвующим. Нельзя ли организовать нечто подобное, только не через веб-интерфейс и с нормальным числом пиков? Ибо это было бы полезно и востребовано. Просто я в программизме не секу ваще.
Те, кто уцелеют, расскажут, как всё было замечательно.

Аватара пользователя
Lust
Сообщения: 607
Зарегистрирован: Вт сен 02, 2003 3:46 pm

Сообщение Lust » Ср окт 15, 2003 2:40 pm

To Satyros: на самом деле хватает 2-3 характерных пиков, чтобы определить соединение... 3 курсу больше и не надо :)

Аватара пользователя
Cezar
Сообщения: 3480
Зарегистрирован: Пт апр 25, 2003 6:31 pm
Контактная информация:

Сообщение Cezar » Ср окт 15, 2003 3:42 pm

Дело не в третьем курсе, такая прога нужна в принципе, для работы. А спектры, которые дают на третьем курсе в обычных группах не требуют большого приложения мозгов. :lol: Хотя я тут лоханулся не по детски давеча на простейшем спектре :oops: :roll:
Необходимость преодоления собственного интеллектуального ничтожества есть необходимое и достаточное ограничение в доступе к научной информации

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8532
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Ср окт 15, 2003 5:15 pm

Мало сечь в программировании, надо иметь под рукой недетскую базу спектров, а её на халяву не даст никто. Если же купить, то (не знаю ситуации конкретно с ЯМР спектрами, но предполагаю так) с ней же продаются средства поиска.

Аватара пользователя
Матроскин
Сообщения: 88
Зарегистрирован: Вт мар 11, 2003 11:13 am
Контактная информация:

Сообщение Матроскин » Ср окт 15, 2003 5:18 pm

Касаемо поиска... Мне кажется уместным искать по названиям. Возможно, общепринятым (читать как "включая тривиальные, номенклатурные и прочие") Но заковырка вся в том, что названий всяких просто немерено... На мой взгляд, в таком случае проще ссделать поиск по всем словам, но только на химических сайтах.
Изображение

Аватара пользователя
Dima_K
Сообщения: 181
Зарегистрирован: Вт окт 14, 2003 3:28 am

Сообщение Dima_K » Ср окт 15, 2003 5:22 pm

ИСН писал(а):Мало сечь в программировании, надо иметь под рукой недетскую базу спектров, а её на халяву не даст никто. Если же купить, то (не знаю ситуации конкретно с ЯМР спектрами, но предполагаю так) с ней же продаются средства поиска.
А ты зайди на сайтик www.sigmaaldrich.com, зарегистрируйся и поищи компаундов - там очень часто дают этого комаунда ЯМР. Вполне можно накачать эталонных спектров. Знаю в ИОХ есть база, но насколько она под РС - не знаю.

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8532
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Ср окт 15, 2003 5:54 pm

to Матроскин: речь о том, что я не могу представить способа автоматического выдёргивания тривиальных химических названий из текста, так что поиск по ним - то же самое, что поиск по всем вообще словам, как в Яндексе. Химические же формулы могут быть охвачены простым регэксом вроде
/(((H|He|Li|Be|B|C|и так далее все остальные)[0-9]*)+)\s/

to Dima_K: спасибо, зашёл бы, если бы было надо. Но одно дело надёргать руками 20 - 100 эталонных спектров, а другое дело - база на десятки тысяч соединений, так? (Речь исключительно внешнего наблюдателя, ибо я ни малейшего отношения к ЯМР не имею).

Ответить

Вернуться в «лицом к лицу»

Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и 202 гостя