DictionaryForumContacts

 Kate-I

link 10.02.2006 15:42 
Subject: Off 2 Alk and all interested parties: насчет оптимизации поиска по сайту
Почему-то мне подумалось, что пора создавать поиск по сайту по ключевым словам в пределах конкретного ника.
Иначе можно очень долго искать то, что нужно. За эти годы накопилось очень много информации.
Например, если знаешь, чье мнение тебе хотелось бы узнать по поводу перевода какого-либо термина, неплохо было бы иметь возможность поиска по ключевым словам в рамках конкретного имени.

В частности, набрав "устав" в обычном поле поиска по сайту, получаешь тонны постов на тему и мимо темы, и никогда не знаешь, кто участвовал в обсуждении.

Что Вы об этом думаете? Такая оптимизация технически возможна?

 alk moderator

link 10.02.2006 16:49 
АП пока еще отбивается, когда я говорю, что надо делать advanced search и по форуму, и по словарю тоже. В форуме добавить фактически фильтр (как тут предлагали) по имени, дате, ну еще там чему-нибудь вроде тематики. И всё. Будет со свистом искать.
В словарном поиске есть тоже несколько спец. дополнений вроде принудительного поиска в форуме (сейчас в форуме ищет только если уж совсем ничего не найдено в словаре, но зато экономится время поиска и нагрузка на процессоры).
В общем, все это технически возможно, но требует усилий АПа...

 operator

link 10.02.2006 16:59 
Про проверку орфографии не забудьте, пожалуйста. Это не только устранит лишний click, но и сократит число ненужных вопросов, типа robast.

 pom moderator

link 10.02.2006 23:15 
Тут есть ряд моментов.

Сейчас поиск в форуме находит первые 100 или 200 подходящих тем, а дальше уже не ищет. Если просто сделать фильтр по нику, придётся перебирать тысячи тем, и вообще всё зависнет. По-хорошему нужно переделать поисковые индексы, чтобы скорость поиска от объёма базы не зависела.

То же самое касается обязательной проверки орфографии. Ведь отключать её никто не будет, а если прогонять сотни страниц через спелл-чекер, тоже нагрузка на сайт повысится.
Может быть, лучше сначала обновить сервер, а потом экспериментировать с форумом.

 alk moderator

link 11.02.2006 7:51 
А кто мешает при поиске по нику также ограничиваться первой сотней?
Стандартная маска поиска на основных форумных движках хорошо разработана, смотрим, например, http://forum.ixbt.com/search.cgi
Искать собственно текст, затем может быть добавлен автор (первый фильтр), дальше идет выбор тематики, что к mt форуму малоприменимо, очень важный блок с датами - последние n-дней, промежуток времени и т.д. и наконец кнопка Поиск. Ну, там по мелочи, искать в заголовках, искать только в ответах, вывести фрагмент, сортировать по дате. Конечно, фильтр по тематике нужен, хоть пока мало кто им пользуется или допускают ошибки, порой преднамеренно, в выборе раздела.
Проверка орфографии нужна только при вводе вопроса, ее я бы включил по умолчанию, при ответах имхо лучше не включать - не так важно, хотя ошибки всегда неприятны.

 pom moderator

link 11.02.2006 8:20 
Если сделать поиск по имени методом перебора, чтобы собрать сто ответов данного пользователя, содержащих данное слово, может понадобиться сквозной просмотр всей базы форума. Нужно будет переделать индексы, включив в них имя и дату.

 Irisha

link 11.02.2006 9:49 
А если так: при сортировке по имени и выбранном списке ответов конкретного пользователя делать поиск только в этом списке (пока расширенного поиска нет)?

 alk moderator

link 11.02.2006 9:52 
АП - Это очевидно, что надо добавить индексных ключей, сквозной перебор недопустим. Я бы еще релевантности добавил, забавно, что юзеры довольно легко подразделяются по тематикам. То есть можно принимать решения о тематике не столько по выбору аскера, сколько по тому, кто ему отвечает ;)
Плюс мне на ум приходит мой любимый Байесов фильтр, который умеет принимать решение о тематике - классифицировать - просто по сумме вероятностей принадлежности каждого слова той или иной тематике. Конечно, его надо учить, но учится он быстро.
Берем popfile.sf.net, эта штука умеет проводить классификацию по любому количеству тем и раскладывать, например, письма по темам (со спамом борется), считая вероятность по словам. Такой алгоритм позволяет текст ветки подгонять под ту и иную тематику, но к сожалению только под одну, пробежавшись по словам, ну и авторам тоже.

 pom moderator

link 11.02.2006 15:55 
Вот прогулялся при -20 градусах, вроде прояснилось с фильтрацией по авторам и датам.

 alk moderator

link 11.02.2006 16:01 
Какие -20, товарисч, уже давно степлело. Какие-то жалкие -12, так что гулять надо в два раз дольше, чтобы прояснилось.

 pom moderator

link 11.02.2006 20:19 
не, у нас северо-запад - тут холоднее :)
Или это я ещё вчера задубел на Арбате.
Кстати, какие впечатления от концерта?

 alk moderator

link 11.02.2006 20:56 
См. в персональном сообщении.

 pom moderator

link 11.02.2006 22:07 
Что-то я уже запутался в этом форуме :)

 Annaa

link 11.02.2006 22:23 
Андрей, это признание стоит многого ;-))

 Brains

link 11.02.2006 22:28 
И Юникод, Андрей Поминов (Мультитран), Юникод… :-)))

 Maxxicum

link 11.02.2006 22:36 
Позволю себе напомнить о своей теме, просьба разработчикам хотя бы отметиться там, дабы быть мне спокойным, что они это видели)
http://multitran.ru/c/m.exe?a=ForumReplies&MessNum=46297&all=1

 alk moderator

link 11.02.2006 23:19 
Maxxicum - Подписка на темы сегодня называется RSS. Но это сразу после юникода.

 Brains

link 11.02.2006 23:31 
Только учтите, Maxxicum, что это он такое утончённое гонево. Дизраэли, мля… :-)

 Kate-I

link 13.02.2006 6:39 
спасибо за разъяснение )

 

You need to be logged in to post in the forum