Subject: Off 2 Alk and all interested parties: насчет оптимизации поиска по сайту Почему-то мне подумалось, что пора создавать поиск по сайту по ключевым словам в пределах конкретного ника.Иначе можно очень долго искать то, что нужно. За эти годы накопилось очень много информации. Например, если знаешь, чье мнение тебе хотелось бы узнать по поводу перевода какого-либо термина, неплохо было бы иметь возможность поиска по ключевым словам в рамках конкретного имени. В частности, набрав "устав" в обычном поле поиска по сайту, получаешь тонны постов на тему и мимо темы, и никогда не знаешь, кто участвовал в обсуждении. Что Вы об этом думаете? Такая оптимизация технически возможна? |
АП пока еще отбивается, когда я говорю, что надо делать advanced search и по форуму, и по словарю тоже. В форуме добавить фактически фильтр (как тут предлагали) по имени, дате, ну еще там чему-нибудь вроде тематики. И всё. Будет со свистом искать. В словарном поиске есть тоже несколько спец. дополнений вроде принудительного поиска в форуме (сейчас в форуме ищет только если уж совсем ничего не найдено в словаре, но зато экономится время поиска и нагрузка на процессоры). В общем, все это технически возможно, но требует усилий АПа... |
Про проверку орфографии не забудьте, пожалуйста. Это не только устранит лишний click, но и сократит число ненужных вопросов, типа robast. |
Тут есть ряд моментов. Сейчас поиск в форуме находит первые 100 или 200 подходящих тем, а дальше уже не ищет. Если просто сделать фильтр по нику, придётся перебирать тысячи тем, и вообще всё зависнет. По-хорошему нужно переделать поисковые индексы, чтобы скорость поиска от объёма базы не зависела. То же самое касается обязательной проверки орфографии. Ведь отключать её никто не будет, а если прогонять сотни страниц через спелл-чекер, тоже нагрузка на сайт повысится. |
А кто мешает при поиске по нику также ограничиваться первой сотней? Стандартная маска поиска на основных форумных движках хорошо разработана, смотрим, например, http://forum.ixbt.com/search.cgi Искать собственно текст, затем может быть добавлен автор (первый фильтр), дальше идет выбор тематики, что к mt форуму малоприменимо, очень важный блок с датами - последние n-дней, промежуток времени и т.д. и наконец кнопка Поиск. Ну, там по мелочи, искать в заголовках, искать только в ответах, вывести фрагмент, сортировать по дате. Конечно, фильтр по тематике нужен, хоть пока мало кто им пользуется или допускают ошибки, порой преднамеренно, в выборе раздела. Проверка орфографии нужна только при вводе вопроса, ее я бы включил по умолчанию, при ответах имхо лучше не включать - не так важно, хотя ошибки всегда неприятны. |
Если сделать поиск по имени методом перебора, чтобы собрать сто ответов данного пользователя, содержащих данное слово, может понадобиться сквозной просмотр всей базы форума. Нужно будет переделать индексы, включив в них имя и дату. |
А если так: при сортировке по имени и выбранном списке ответов конкретного пользователя делать поиск только в этом списке (пока расширенного поиска нет)? |
АП - Это очевидно, что надо добавить индексных ключей, сквозной перебор недопустим. Я бы еще релевантности добавил, забавно, что юзеры довольно легко подразделяются по тематикам. То есть можно принимать решения о тематике не столько по выбору аскера, сколько по тому, кто ему отвечает ;) Плюс мне на ум приходит мой любимый Байесов фильтр, который умеет принимать решение о тематике - классифицировать - просто по сумме вероятностей принадлежности каждого слова той или иной тематике. Конечно, его надо учить, но учится он быстро. Берем popfile.sf.net, эта штука умеет проводить классификацию по любому количеству тем и раскладывать, например, письма по темам (со спамом борется), считая вероятность по словам. Такой алгоритм позволяет текст ветки подгонять под ту и иную тематику, но к сожалению только под одну, пробежавшись по словам, ну и авторам тоже. |
Вот прогулялся при -20 градусах, вроде прояснилось с фильтрацией по авторам и датам. |
Какие -20, товарисч, уже давно степлело. Какие-то жалкие -12, так что гулять надо в два раз дольше, чтобы прояснилось. |
не, у нас северо-запад - тут холоднее :) Или это я ещё вчера задубел на Арбате. Кстати, какие впечатления от концерта? |
См. в персональном сообщении. |
Что-то я уже запутался в этом форуме :) |
Андрей, это признание стоит многого ;-)) |
И Юникод, Андрей Поминов (Мультитран), Юникод… :-))) |
Позволю себе напомнить о своей теме, просьба разработчикам хотя бы отметиться там, дабы быть мне спокойным, что они это видели) http://multitran.ru/c/m.exe?a=ForumReplies&MessNum=46297&all=1 |
Maxxicum - Подписка на темы сегодня называется RSS. Но это сразу после юникода. |
Только учтите, Maxxicum, что это он такое утончённое гонево. Дизраэли, мля… :-) |
спасибо за разъяснение ) |
You need to be logged in to post in the forum |