DictionaryForumContacts

 DRE

link 9.12.2016 9:05 
Subject: Предложение по исправлению ошибок в словаре multitran gen.
Дорогие владельцы сайта multitran!

Ошибки в словаре, о которых сообщают пользователи, - части речи, орфография, точность значений, дублирования и т.п. годами висят в словаре без исправления!

Если владельцы не способны заниматься внесением правок, предоставьте такие права пользователям. Предложение по этому поводу:

Предложение по этому поводу: любой пользователь может предложить правку в статью любого пользователя, статья получает метку правки с датой и именем автора правки, исходный автор статьи (если он существует) получает уведомление о предложенной правке, появляется возможность зарегистрированным пользователям «плюсовать» и «минусовать» правку. Правку может сразу внести исходный автор статьи, если он получил уведомление и согласился с предложением. Также, правка утверждается и вносится системой автоматически после того, как она набрала +5 голосов.
Для большей надежности можно добавить рейтинг авторов/редакторов статей (с плюсованием и минусованием), можно внести ограничение по возрасту учетной записи – например, право голосовать, предлагать правки и добавлять статьи пользователь получает через полгода, и теряет на несколько недель, если его заминусовали.

 alk moderator

link 9.12.2016 10:38 
К сожалению, все это не слишком осуществимо. Требуется отдельная и весьма непростая система ведения рейтинга. Логично было бы внедрить пользовательский рейтинг контрибуторов, то есть не тупо по количеству терминов, а мы видим, что это не здорово, а по тому, как другие пользователи оценивают вклад. Если минусуют, у контрибутора отключается возможность добавлять новые термины вообще или до пор, пока он НЕ ИСПРАВИТ или УДАЛИТ сомнительные термины.
Напомню, сейчас схема такова.
Пользователь добавляет термин в словарь, после этого другие могут сообщать об ошибке при добавлении. Добавителю приходит письмо, где написано, что к его термину есть комментарий/сообщение об ошибке. Если он внесет исправление, комментарий в словаре исчезает (и остается только в профиле комментатора для хронологии). Таким образом, добросовестный контрибутор следит за своими статьями.
Статьи, добавленные Разработчиком словаря, могут быть исправлены/удалены либо им самим, либо редакторами. Число редакторов мало, поэтому сейчас имеет смысл позаботиться об их росте. Нужны уравновешенные и знающие специалисты, пока эта работа на общественных началах, но возможно в ближайшее время удастся перевести ее на коммерческие рельсы.

 trtrtr

link 9.12.2016 11:03 
На мой взгляд, даже такая (as is) система продуктивна, если воспринимать предлагаемые термины критически, перепроверять. Просто нужно отдавать себе отчет в том, что термины предложены пользователями (как правило, нет коллективной редакторской работы), а значит, всегда возможна ошибка.

 DRE

link 9.12.2016 11:58 
alk. Я понимаю, что система рейтингов контрибьюторов и редакторов может быть сложной и это вопрос на перспективу.
Существующая система, очевидно, не работает. Авторы добавлений не исправляют отмеченные ошибки, и они копятся.

Но плюсование-минусование предложенных правок можно реализовать и без рейтингов пользователей и должно быть гораздо проще. Многие ошибки настолько очевидны (неверная часть речи, орфография), что правка может получить 5 плюсов за неделю или день (а не висеть годами, как это сейчас), и будет принята без необходимости наращивать штат редакторов. Это решит вопрос в корне и будет стоить дешевле в долгосрочной перспективе.

Причина, почему я предолжил систему рейтингов, заключается в том, что потенциально существует риск злоупотребления этой системой, где группа из 5 лиц может по сговору удалить и испортить много статей. Но риск не такой большой в реальности - разрешить правки только пользователям, зарегистрированным более года назад, например, и если хранить журнал исправлений, то в случае обнаружения злоупотреблений, исправления можно будет найти все по имени пользователя и отменить, а пользователей заблокировать.

Нужно начать с простого, чтобы процесс уже пошел, а доделать систему и сделать ее более надежной можно и позднее.

 ttimakina

link 9.12.2016 13:15 
Я поддерживаю идею редакторов-специалистов по конкретным тематикам. Надо вычищать неверное, истреблять многочисленные повторы и пр.
С замусориванием словарей можно бороться премодерацией. Т.е. новые термины сперва смотрит тот самый редактор той самой тематики. Он может принять, отвергнуть, скорректировать (на свое усмотрение (не обязательно) связаться с пользователем, предложившим новый термин).

 trtrtr

link 9.12.2016 13:16 
На мой взгляд, премодерация - хорошая идея. Но, возможно, слова добавляются так быстро, что нужно много редакторов. Не все будут работать бесплатно.

 Syrira

link 9.12.2016 13:49 
А я не очень согласна. Для добросовестного переводчика словарь - это только отправная точка, он обязательно сам всё проверит, прежде чем брать себе, а недобросовестному и бездумному всё равно ничего не поможет. А строгая премодерация - это в какой-то степени вкусовщина в отношении слов общего плана, а в отношении новых технических терминов ни один даже самый опытный переводчик всего знать не может, а инженеров у нас здесь нет в таких количествах.

 A.Rezvov

link 9.12.2016 16:09 
Для добросовестного переводчика словарь - это только отправная точка...

Абсолютно согласен!

 wow2

link 9.12.2016 16:22 
как показывает из разу в раз мультитран (щедро пополняемый руками переводчиков, черпающих энергию из каких-то неисчерпаемых источников), эта мысль работает и в обратную сторону:

Для добросовестного словаря переводчик - это только отправная точка...

 DRE

link 9.12.2016 16:23 
Постоянно появляется много новых терминов на все более узкие тематики, плюс
накопился огромный "багаж" правок прошлых лет, требующих внесения. Профессиональные редакторы-лексикографы — решение самое качественное, но долгое и дорогостоящее (возможно, экономически не оправданное).

Поэтому я и предлагаю перенимать опыт википедии и других публичных проектов, только в упрощенном варианте.
Голосование плюс-минус с одной стороны просто реализовать, с другой — бесплатно задействует неисчерпаемый и оперативный ресурс — энтузиазм переводчиков.
Порядка станет сразу больше! Это подход будет естественным продолжением текущей политики развития словаря: в отличие от многих других ресурсов multitran позволяет и доверяет пользователям вносить новые статьи! Напрашивается следующий шаг — добавить коллективную защиту от ошибок.
Отдельные случаи злоупотреблений можно по-началу лечить в индивидуальном порядке — вручную, по уведомлению специалистами сайта. А в дальнейшем может назреть потребность в рейтингах редакторов и авторов, но к этому времени словарь уже будет выглядеть прилично, а не как

 DRE

link 9.12.2016 16:31 
Коллеги,
пожалуйста, поменьше флуда! Про добросовестных переводчиков и прочую философию — в другую тему.

Конкретно, кто поддерживает инициативу, кто против, почему, и какие компромисы можно предложить.

 Peter Cantrop

link 9.12.2016 16:37 
я хорошие варианты и в облаке мусора находил
если удалять,то уж явные ошибки.

на первом этапе редактирования надо защитить правильные или контекстные варианты флажком, которые ставят другие пользователи. но долго их копить

 ROGER YOUNG

link 9.12.2016 16:56 
думаяю что такую проверку должны проводить высококвалифицированные спецы по филологии а не вчерашнее студенты со скамьи а то получиться черт знает что

 Tante B

link 9.12.2016 16:57 
никто, ничто и никому не мешает писать комментарии к вариантам, которые кажутся (sic!) ошибочными
как и на любом другом сайте, пользователь должен (sic!) сначала разобраться, какому зверю из здешнего зоопарка верить, а какому погодить
то есть, присоединяюсь к предыдущим ораторам (Syrira, A.Rezvov, Peter Cantrop)
ваша черепаха тортилла :)

 wow2

link 9.12.2016 17:05 
1. для всех вариантов в словаре ввести дополнительный признак, "степень доверия" (или надежности, или наоборот скепсиса)

2. далее самым эффективным будет перейти на личности: все пользователи получают "ранг" (изначально небольшой отрицательный).
ВСЕ непроверенные термины/варианты, добавленные пользователями, получают "степень доверия" в зависимости от ранга пользователя их добавившего. далее степень доверия каждого термина можно корректировать отдельно. корректировка ранга пользователя - еще более отдельная задача.

таким образом, если кто-то из лексикографов сильно плодовит, то можно потратить очень немного времени на корректировку их личного ранга - и это сразу отразится на многих вариантах в словаре.

 SirReal moderator

link 9.12.2016 17:12 
никакие обсуждаемые здесь предложения реализованы не будут, насколько бы разумными и рациональными они ни оказались. как и во всех проектах, которые пилит один разработчик-самоучка.
увы.

 wow2

link 9.12.2016 17:16 
а нанять?

 alk moderator

link 9.12.2016 18:12 
самоучка-то он, конечно, но идей в голове довольно много, весьма нестандартных, как и всех самоучек. Что и не позволяет рассчитывать на какую-либо преемственность и найм - есть либо добротные программисты, ничего не понимающие в лингвистике, либо прекрасные лингвисты, не умеющие программировать.
Полагаю, что если бы идея некого рейтинга (пока не ясно чего) была достаточно безумной, то за нее бы Разработчик взялся.
Я тоже придерживаюсь мнения, что комментарии к переводам в большинстве случаев достаточны, чтобы уберечь от ошибок. Ошибки, таким образом, можно и не исправлять. Когда-то это задумывалось по аналогии с Википедией, только там совместное редактирование, а здесь совместное комментирование.

 wow2

link 9.12.2016 18:21 
мдя... безумных идей лучше наверное ждать от лингвистов :)

 DRE

link 9.12.2016 18:35 
wow2, "Степень доверия" не решит ту проблему, которая имеется на сайте сейчас, и вот почему!
Посмотрите иллюстрацию по ссылке - это снимок экрана с одного произвольно выбранного термина для примера, и таких примеров - полный словарь.
https://goo.gl/photos/9uBgfN5qjWctu45m6
Мы видим:
1. Исходный объем терминов сайта (без имени пользователя) теряется на фоне подавляющего большинства терминов, добавленных пользователями, а это значит, что роль пользователей на данном этапе больше, чем роль редакторов сайта.
2. Имеются ОЧЕВИДНЫЕ ОШИБКИ (не верно указана часть речи) в исходных терминах словаря, так и в добавленных пользователями, о которых СООБЩЕНО пользователями.
3. Ошибки остаются неисправленными годами (это не очень видно из снимка, но я на этом сайте с 1997 года, и те, кто здесь давно, подтвердят), поэтому статьи выглядят грязно и их тяжело читать как из-за самих ошибок, так и из-за нагромождения замечаний об ошибках.

Поэтому, раз уж пользователи могут добавлять термины, то они должны иметь возможность и исправлять!
Голосование за правку +5 достаточно для коллективного подтвердения правки, чтобы исключить глупые и случайные правки.
Голосование -3 против правки приводило бы к ее удалению, чтобы она не болталась.

Если бы владельцы сайта имели желание и ресурсы нанять редакторов в достаточном количестве, то это давно было бы сделано. Но это, очевидно, не так! Поэтому, просто дайте людям недостающий инструмент - самый простой и эффектвный, который можно на данный момент придумать.

Рейтинги и степени доверия можно добавить потом для удобства, но пока что нужно просто мусор почистить!

SirReal, я не столь пессимистично оцениваю эту перспективу, потому что сайт по-немногу развивается, появилась новая бета-версия. Есть мобильное приложение.. То есть что-то делается.. Я прошу поддержки иницитивы, чтобы направить развитие в нужное русло.

 wow2

link 9.12.2016 18:57 
\\\ прошу поддержки иницитивы, чтобы направить развитие в нужное русло.

ответ на вопрос какое русло тут самое нужное, и соотв-но что именно поддерживать, далеко не очевиден.

варианта "просто дайте людям недостающий инструмент" на самом деле не существует:
чтобы дать, надо сначала сделать (спроектировать и реализовать), а сделать будет НЕпросто - читайте про это в 9.12.2016 20:12 и 9.12.2016 21:12.
ввиду этого, ваш тезис "самый простой и эффектвный" вовсе не истина.

да и если брать ваше предложение в аспекте пользы, оно не обязательно самое толковое. например:

в вашем предложении людям придется работать по каждому термину
-тогда как-
в моем предложении можно одним движением снизить рейтинг пользователя -- и все его 100+ тыс. "терминов" последуют за ним (на них тут же распространится его низкий рейтинг).

это я не к тому, что мое лучше. это я к тому, что подумать есть о чем - не все так очевидно как вы это пытаетесь представить общественности.

 Wlastas

link 9.12.2016 20:04 
Есть куда более простое и незатратное решение по улучшению выдачи - нужно её сократить и конкретизировать:
Для этого:
1) Текущий плоский список категорий детально и качественно переформатировать в древовидный, так, чтобы более узкоспециализированные разделы входили в более глобальные.
Например: дентальная имплантология ==>стоматология==>медицина==>ну вы поняли:
Это позволит несколькими кликами переключать контекст словаря в зависимости от насущных нужд переводчика. Для этого надо реализовать внятный интерфейс с визуальным "древом" с галочками.
2) Надо добавить интерактивный фильтр по части речи.
Это минимум в 3 раз сокращает объём "мусора" при запросе. Реализовать в виде доп панельки с галочками как на форме поискового запроса так и на странице выдачи.
2а) Сразу же позволить всем залогиненным пользователям вносить правку части речи у чужих статей. Сделать это через примитивный алгоритм: Сейчас это существительное. Трое разных пользователя нажало "глагол" => Статья стала глаголом. На крайняк принимать голоса только с аккаунтов месячной выдержки. Все.

В программном плане обе эти задачи крайне простые и их можно реализовать буквально за день вместе с отладкой.
PS Кстати сокращение числа выдаваемых статей резко снизит нагрузку на сервер, и значит возможно, позволит подключить поиск по базе параллельных предложений - ну эта другая отдельная и важная тема.

 wow2

link 9.12.2016 20:11 
\\\ В программном плане обе эти задачи крайне простые и их можно реализовать буквально за день вместе с отладкой.

короткий ответ - нет

пояснение: подобные оценки можно выдавать только для greenfield project-ов, где есть полная свобода выбора технических средств и где нет привязки к существующему коду или существующей базе данных. в нашем же случае (равно как и в любых аналогичных) только человек основательно покопавшийся в проекте может что-то оценить.

 juliedor

link 9.12.2016 20:18 
Для меня то, что я прочитала по поводу правок в мультитран: ужас...
Отдавать конечный вариант решения вносить/не вносить вариант перевода на crowd-sourcing, мне представляется, что это "добить" мультитран до конца. Он и так превращается в определенный трэш из набора ерунды... SOS!
Извините, проект мультитран - мощный, но "убить" можно любое дело.
Представляется, самое простое решение - дать возможность самим пользователям отключать переводы пользователей в своих версиях для работы, но и оставить возможность включать переводы, оставленные модератором и определенных пользователей по выбору конечного потребителя (переводчика). Переводчиков, чьи предложения безусловно хочется оставить не так много. (В моем видении вопроса).

Второй путь - превратить мультитран в нормативный источник, но здесь требуется кропотливая работа на начальном этапе, чтобы проект дальше жил и совершенствовался без особых в дальнейшем проблем, с вносящими свои переводы (изменить формат внесения переводов самими переводчиками, т.е. изменить требования к внесению перевода; оставить модераторов; привлечь в качестве редакторов экономистов/юристов/лингвистов с подтвержденными знаниям к.ю.н, д.ю.н., к.ф.н., к.э.н. и т.. по тематикам (со знаниям языка безусловно) Т.е. фактически перейти к той практике, которая существовала при формировании бумажных словарей. Эти люди будут работать и добросовестно и без затрат, т.е. без оплаты, так как такой вид работы ценится в вузах и очень хорошо оплачивается (не разовые выплаты, а при постоянном формировании зарплаты, т.е. большими бонусами к окладам + престиж быть редактором уважаемого ресурса). А для администратора - время на поиск и формирование команды таких специалистов.
На сегодняшний день ситуация на мультитране такая: смотришь, человек свое то резюме грамотным русским языком написать не умеет, а уже предлагает переводы в специализированные эк/юр словари:) А если суржик или местный диалект внесен:)
Извините, наболело...
Всего доброго.

 Wlastas

link 9.12.2016 20:44 
2 wow2
Вне зависимости от текущей реализации (а вы в курсе на чем это все написано и как крутится?), оба вопроса банальны и примитивны и решаются в 30 строк кода. +доверстка пользовательских интерфейсов в количестве 3 штук(с учетом админки для переформатирования списка).
Давайте обсудим целесообразность, а по поводу возможностей/сложностей реализации спросим непосредственно у разработчика.

 wow2

link 9.12.2016 20:48 
\\\ по поводу возможностей/сложностей реализации спросим непосредственно у разработчика.

согл 100%
(именно потому и предлагаю воздержаться от домыслов и не распускать слухи о том, сколько строк кода или дней работы это может стоить)

 Wlastas

link 9.12.2016 21:01 
Дык про время реализации я написал не ради слухов, а лишь чтобы показать, что данное предложение в техническом плане в разы проще, чем раздача прав на модерирование, создание рейтинговой системы пользователей/модераторов и прочая прочая. Все это, несомненно, в каком-то виде нужно - но это явно надо делать с нуля.
Я же предлагаю подправить то, что уже есть.

 DRE

link 9.12.2016 21:11 
Wlastas, ваши идеи мне очень импонируют. Пункт 2а) - это практически суть моего предложения. Пункты 1) и 2) - хорошие дополнения

Juliedor, "Для меня то, что я прочитала по поводу правок в мультитран: ужас...
Отдавать конечный вариант решения вносить/не вносить вариант перевода на crowd-sourcing, мне представляется, что это "добить" мультитран до конца."
Ужас как раз в текущей ситуации, когда вносить/не вносить вариант перевода позволено всем пользователям, а исправлять на практике не может никто. Правки можно только предложить в виде сообщений об ошибках, но их не исправляют ни авторы статей, ни модераторы сайта. Если вы видели предлагаемые правки, вы должны были заметить, что проблемы "нелепых" правок нет, правки как раз все предлагаются грамотные. Проблема в том, что они никогда не вносятся. Раз уж пользователям разрешено добавлять, то логично было бы разрешить и исправлять.

"Второй путь", безусловно, прекрасен, только в условиях, когда у сайта нет ресурсов, чтобы части речи исправить, говорить о нем "преждевременно". Ну только владельцам известно, что им проще и какой путь развития они себе представляют.

Наша задача как пользователей — громко заявить о проблеме. И я прошу поддержки в этом.

 juliedor

link 9.12.2016 22:27 
Ужас как раз в текущей ситуации, когда вносить/не вносить вариант перевода позволено всем пользователям (УЖАС В НЕБРЕЖНОСТИ ВНЕСЕНИЯ ПЕРЕВОДОВ), а исправлять на практике не может никто.
- МОДЕРАТОРЫ МОГУТ
Правки можно только предложить в виде сообщений об ошибках, но их не исправляют ни авторы статей, ни модераторы сайта. Если вы видели предлагаемые правки, вы должны были заметить, что проблемы "нелепых" правок нет
УВЫ, ЕСТЬ И ЕЩЕ КАКИЕ.. (засветить свою "компетенцию").
правки как раз все предлагаются грамотные. (СМ. ВЫШЕ)
ОДИН "ГРАМОТНЫЙ" ПЕРЕВОДЧИК (или не переводчик) ДОБАВИЛ "ФИГНЮ", А ВТОРОЙ "ГРАМОТНЫЙ" ПЕРЕВОДЧИК (или не переводчик), СЧИТАЮЩИЙ, ЧТО ОН КВАЛИФИКАЦИЕЙ НЕ ХУЖЕ, ПОДПРАВИЛ
ЭТА ПРОБЛЕМА ЕСТЬ (мне так представляется).
Проблема в том, что они никогда не
вносятся. Раз уж пользователям разрешено добавлять, то логично было бы разрешить и исправлять.
ЧТОБЫ ВСЕ ПРИВЕСТИ К ОКОНЧАТЕЛЬНОМУ БАРДАКУ. ПУСТЬ УЖ СВЕТИТСЯ "ЗЕЛЕНЫМ" И С НИКОМ, ЧТО ВАРИАНТ ОТ ЖЕЛАЮЩЕГО ВНЕСТИ СВОЮ ЛЕПТУ В МУЛЬТИТРАН и ЗАСВЕТИТЬ СВОЮ "НЕТЛЕНКУ"
А МОДЕРАТОРОМ СПАСИБО, ЧТО ПО МЕРЕ СИЛ И ВОЗМОЖНОСТЕЙ УБИРАЕТЕ НЕНУЖНОЕ (но, увы, компетенции модераторов в спецсловарях уже недостаточно).

P.S Крупный шрифт - выделить ответы и не более, а то есть такая "тема", что воспринимается как повышение тона:)
Всего доброго.

 DRE

link 10.12.2016 5:20 
Juliedor, даже если большинство пользователей пришло бы к единому мнению, может ничего не поменяться. Но если пользователи не могут прийти к единому мнению, то ничего точно не поменяется.
Я бы согласился с вашей позицией оставить все как есть лет пять назад. Тогда я еще надеялся на пользовалей, что они прислушаются к замечаниям и исправят свои статьи, или на вмешательство модераторов. Но я больше не считаю возможным оставлять все как есть, потому что ничего не меняется годами и модераторы никак не справляются. Замечаний становится все больше, и они только ухудашают читабельность статей, но не приводят к исправлениям.
Вот мой список замечаний за последние как минимум два-три года (жаль даты не хранятся).
http://www.multitran.ru/c/m.exe?a=68&UserName=DRE&l1=1&l2=2

Их было бы больше, но я перестал писать замечания по поводу неверных частей речи, потому что не вижу больше в этом смысла, если это ни на что не влияет.

Вы можете не согласиться с какими-то моими замечаниями, и написать свое замечание в ответ на мое замечание - и это ничего не поменяет! Нет действующего механизма исправления.
Вы согласитесь, полагаю, с большинством моих замечаний, некоторые из них очевидные, но это ничего не поменяет в текущей ситуации - потому что никто не вносит правки. Но если бы механизм правок на основе консенсуса был бы реализован, большинство этих замечаний уже были бы внесены, а замечания сняты.

Если эту или какую-то более эффективную инициативу не поддержать, мы вернемся к этому вопросу еще через год, когда бардака будет еще больше.

 Tante B

link 10.12.2016 10:54 
остаюсь при своём мнении и уже вижу в выступлении ТС больше саморекламы, чем конструктивности
ломать --- не строить, к сожалению
а у пользователей здесь задач нет :)

 Syrira

link 10.12.2016 11:06 
и что уж так дались эти ошибки с частями речи, чему они практически мешают? ну да, не comme il faut, но у нас здесь не академический словарь в конце концов. у меня есть стационарная версия, где с частями речи всё в порядке, но я ее открываю только если сайт падает.

 натрикс

link 10.12.2016 12:15 
абсолютно согласна с двумя предыдущими ораторами.
от себя добавлю, что по моим ощущениям и наблюдениям все эти озабоченности "судьбами словаря" вызваны тем, что все больше и больше так называемые переводчики привыкают надеяться на "современные технические средства" и все меньше и меньше - на собственную голову. вот и ожидают, что приедет специально обученная коллегия умных теть и дядь-специалистов, набросают хороших и единственно правильных вариантов, а плохие вычистят. и будет всем щастье. а что словарь не догма а руководство к действию - никто и думать не хочет. и что ежели чего - литературу по теме надо читать и со специалистами консультироваться. очевидно, религия им этого не позволяет.
разработчикам и лицам к ним приближенным хочу сказать спасибо и напомнить, что лучшее - враг хорошего. и не надо пытаться чинить то, что скрипит, но худо-бедно работает и жизнеспособно. а ежели появится творческий zest - имхо стоит направить его на то, чтоб устранить чисто технические неполадки. как-то так я ситуацию вижу.

 DRE

link 10.12.2016 14:26 
Просто царство гудынафов какое-то!
Все понятно, вопрос снимается.

 DRE

link 10.12.2016 15:12 
натрикс: "Что?! Кто-то предложил что-то улучшить?! В общем-то, по большому счету мне пофиг, и даже может быть от этого будет польза, и можно просто проигнорировать, пусть кому надо, тот и бьется… Но нет – я не могу этого допустить! Но почему? Разве не лучше, когда лучше? В чем по сути опасность предложения? Не знаю, но лучшее враг хорошего – научный факт! По крайней мере в России. И чувак мне этот не нравится! Сильно активный, выскочка, да! Надо гасить! И переводчик, наверняка, плохой! Если ему трудно среди глаголов найти существительное - явный лох! Хаха, не то что я! Мне и так покатит, у меня есть выносливость, и в этом моя гордость! Напишу пустой пост с едкими общими фразами и намекну, что автор лох, это должно сработать!"

 alk moderator

link 10.12.2016 16:01 
DRE - не стоит переходить на личности, очень легко все можно скатить все в склоку.
Предложения ваши конструктивные, но надо это лучше осмыслить и понять, что реально можно улучшить, а что усложнить или запутать.
Кроме того, нужно четко представлять, что сайт, движок, базы - это все совершенно нестандартное, созданное долгими годами кропотливого труда и под обычные схемы вроде php-sql и им подобные просто не подходят.
Можно сказать, что сайт - чисто заказная микросхема, штучный товар. Его очень трудно понять, там множество весьма непростых решений, одно из главных уникальных свойств - это морфологическая модель, именно там надо исправлять части речи, а это весьма непросто.
По поводу тематик - я неоднократно писал, что их множество - результат внедрения информации из огромного количества специализированных словарей, поэтому так много и отдельно. Сама задача их объединения (иерархическому или линейному) очень непроста из-за субъективности. Кому-то захочется собрать так, кому-то иначе, а кто-то жалуется, что их просто слишком много.
Итак, сейчас надо разобраться, что же, собственно, больше всего требуется, а что может подождать.

 ttimakina

link 10.12.2016 16:34 
juliedor, что, правда кандидаты и доктора наук за бесплатно станут прилежно и с охотой работать? Что за идеи?

 ttimakina

link 10.12.2016 16:43 
Относительно "голосований". Объем словаря огромный. Какова вероятность, что в течение даже месяца одну и ту же статью увидят пять человек, да еще будут знать, что можно проглосовать и заморочатся потратить на это время? Это не будет работать. Можно (может быть!) рассчитывать на то, что грамотные специалисты, наткнувшись в процессе поиска по словарю на неверные статьи и многочисленные дублирования, и имея определенные права доступа, будут постепенно вычищать очевидно неприемлемые переводы. И то, если у них будет в тот момент достаточно времени и желания потратить свое время на благотворительность.

 Wlastas

link 10.12.2016 16:56 
2 alk
Дык не надо ничего ломать/переписывать движок/пересобирать базы и т.д.
Просто доп. инструмент для конечных пользователей, позволяющий ограничить выдачу по уже имеющимся критериям.
***это морфологическая модель, именно там надо исправлять части речи, а это весьма непросто***
какая связь между "моделью" и "данными", добавленными пользователями? Если данные разделены помимо прочего и по частям речи(а именно так и должно быть для ускорения выдачи) то введение этого фильтра в запрос значительно ускорит саму выдачу. Стоит галочка - только глаголы - запрашиваем только их, стоит галочка выдавать все - выдаем в точности так, как это реализовано сейчас.
В любом случае, раз есть возможность замены части речи у владельца статьи, значит эту операцию можно разрешить проводить любому пользователю(как именно, см выше).

***Кому-то захочется собрать так, кому-то иначе*** а вот это как раз можно и нужно обсудить. Сделать админку для рассовывания текущих разделов - выдать проверенным пользователям права на работу с ней и пускай грызутся/обсуждают в отдельной теме. Единственные трудности тут могут быть только с ветками верхних уровней - на сколько частей делить основной "ствол" - ну так даже это должно получиться само, как только текущий список начнут приводить к древовидному

 DRE

link 10.12.2016 17:27 
alk, замечание принимаю, виноват, был в отчаянии.

"Итак, сейчас надо разобраться, что же, собственно, больше всего требуется, а что может подождать."

Меня в любом случае радует, что, как я понял из ваших слов, у разработчиков есть понимание проблем и желание их решать.

Если речь идет о выборе - объединить тематики и создавать их иерархию или внедрить механизм исправления ошибок сайта - можно начать с того, что проще и быстрее, а потом сделать второе. Мы не платим за продукт, можем и подождать :)

Я надеялся, что обсуждение в этой теме форума поможет понять предпочтения пользователей, но это оказалось не просто, потому что самую активную позицию занимают те, кого все устраивает.

Если говорить именно о механизме исправления ошибок, можно голосование (вариант 4а) дополнить модерированием (4б).

Как вам такой механизм:
1. Пользователь, зарегистрированный на сайте более года, вносит исправление.
2. Радом с термином в старом виде появляется в скобках зеленым исправленный вариант с обозначением части речи, а также комментарий, имя пользователя, дата?, "плюс" с числом голосов и "минус" с числом голосов.
Пример:
исправление части речи
draw гл. общ. тяга (тянуть, сущ., (комментарий, пользователь, дата,) +3 –0)
предложение об удалении термина
draw гл. | Вебстер | фразы
разг. отпущать ([удалить], гл, (impf only; = отпускать; yingster [дата]) (по Орфографическому словарю — отпущать, -аю, -ает (прост. к отпускать) Gruzovik, [дата],) +1 –2 )

Для голосования, редактирования и комментирования откывается отдельная страница.
3. Если число минусов достигает двух (или трех), правка удаляется автоматически.
4а. Если число плюсов достигает трех (или пяти), правка применяется, старый вариант удаляется в архив статей.
4б. Если число плюсов достигает трех (или пяти), правка поступает модератору/редактору, он подтверждает правку (или удаляет правку и блокирует при необходимости пользователей).

Опять же для простоты можно сначала реализовать вариант 4а, а потом по мере необходимости и возможности, дополнить вариантом 4б.

 DRE

link 10.12.2016 17:36 
2 ttimakina
Мы не ограничены одним месяцем. Ошибки висят годами. Если правка получит 5 голосов через год и будет внесена - это будет успех.
Если в текущей ситуации есть масса желающих и уверенных в своих знаниях людей, чтобы добавлять статьи и писать замечания, значит желающих тратить время, чтобы вносить правки и голосовать за них, будет достаточно.

 alk moderator

link 10.12.2016 17:55 
Wlastas - поймите, то, что Вы видите на сайте, это видимая часть айсберга. Огромная часть не видна, она формировалась годами, это то, каким образом был сформирован словарь. Там тысячи операций по преобразованию разрозненных, большей частью отсканированных текстов. Там и морфология, и тематики, и всё, что в конечном итоге видно пользователям как онлайн-словарь. И это все работает, в словарь постоянно добавляются термины самим автором. Десятки тысяч терминов.
Новая версия ушла значительно дальше, там какое-то астрономическое количество языков и их пар. Многое было переработано, какие-то вещи "отвалились", и может, напрасно, но есть костяк, "святая святых", которую ломать уже поздно. Связь между моделью и данными такая, что к каждому слову, добавленному в словарь, после множества проверок, добавляется часть речи, которая в дальнейшем используется для морфологического разбора. Если слово таково, что оно и существительное, и глагол, то в морфологическом разборе будет показано отдельно по каждой части речи. Как я понимаю, именно сложность добавления слова в морфологическую модель и не позволяет так просто менять ошибочно введенную часть речи, поэтому это не доступно редактору словаря.
Пока наиболее доступными для реализации выглядят следующие пункты. Во-первых, те, кто действительно хочет помочь редактировать словарь и имеют какой-то послужной список как контрибуторы (не обязательно массовые), могут написать письмо мне или автору словаря, и статус редактора будет выдан. Во-вторых, можно сделать историю редакторских правок, из которой будет видно всем, действительно ли редактор дело делает. Кроме того, возможно, имеет смысл ввести рейтинг соавтора, чтобы была более заметная обратная связь и ответственность контрибутора за работу над ошибками.

 DRE

link 10.12.2016 19:21 
Контрибутор = соавтор?

Ну если так проще, давайте попробуем так.

Поскольку мало кто читал эту ветку, можно добавить список редакторов в раздел контакты, чтобы пользователи знали, что есть к кому обращаться, и чтобы редакторы могли общаться между собой.
И там же приписать: "подать заявку на права редактора можно <здесь>".

Редакторы могут сами установить, хотят ли они, чтобы их контакты были видны вообще, или не-редакторам, или чтобы они были доступны для связи через сайт.

Когда будет реализовано, там же могут появиться рейтинги/статистика по редакторам.

Редакторам пригодился бы поиск/фильтр по терминам, содержащим ошибки, с фильтрами по тематикам, не знаю реализовано ли это..

 wow2

link 10.12.2016 19:35 
а есть ли у редактора простой способ накрыть сразу пачку "терминов", набросанных в словарь неудержимым лингвофлудером?

или такая функция им нужна как коту пижама?
http://www.multitran.ru/c/m.exe?l1=1&l2=2&s=like+a+bastard+at+a+family+reunion

 натрикс

link 10.12.2016 19:51 
наташа игишева - тоже известный лексикограф, а то заладили - грузовик, грузовик... но иногда мне нравится ее термины почитать - чисто тупо поржать. хотя если кто-то почистит - я лично не обижусь:)

 ttimakina

link 10.12.2016 20:11 
натрикс, +1
У меня еще несколько этих, как их... контрибуторов "любимых" есть. Я один раз сунулась, спросила нельзя ли выкосить определенного контрибутора. Больше не хочу.

 alk moderator

link 10.12.2016 21:00 
нет, пачками редактор не может (если только не освоит curl и запросы POST в нем)

 Peter Cantrop

link 11.12.2016 13:05 
можно предоставлять право редактирования рейтинговым форумчанам, т.е. на первом этапе организовать проставление рейтинга за ответы,
1.точные, профессиональные
2 удачные и
3 наводящие. подсказки
и минусовой - абсолютно неправильный

рейтинг могут проставлять не только вопросившие аскеры, но и любые форумчане, посетившие ветку ответа.
естественно, рейтинги получать будут опытные и профессиональные переводчики.

после этого этим мэтрам дается право удалять мусор.

Может еще какие критерии

 juliedor

link 11.12.2016 16:58 
"рейтинговым форумчанам"
Извините, но здесь в очень-очень рейтинговых имеются люди, которые даже английского не знают, не имеют высшего образования, снимались в реалити-шоу (что их личные трудности), при этом слывут знатоками в одном из словарей по юриспруденции и финансам и в форумах...

Потом обратите внимание: как люди общаются друг с другом на форуме. Вы думаете, бОльшей частью они здесь разведут меритократию:) (т.е. будут беспристрастны в оценках... ну-ну).

Как-то очень давно (ни один год назад) рискнула исправить очевидный ляп в термине, (прислала на почту одному вносителю или вносительнице ценной лексики и пояснений в словарь, и не светила ляп в словаре.) Не буду пояснять, что было в ответ... Увы, такова реальность.

Вердикт: пусть оценивают в кудоз, а здесь меня вполне устраивает, что эти перлы принадлежат пользователями под именами и кликухами, главное - эту пометку не убирать:)
К теме еще вернусь по поводу совершенствования словаря... так как есть еще statements less emotional:).
Всего доброго.

 Wolverin

link 11.12.2016 17:04 
а кто снимался в реалити-шоу, и в каком шоу?

 перевод73

link 11.12.2016 17:20 
**но здесь в очень-очень рейтинговых имеются люди, которые даже английского не знают, не имеют высшего образования, снимались в реалити-шоу (что их личные трудности), при этом слывут знатоками в одном из словарей по юриспруденции и финансам и в форумах.**

Кто же это такие, интересно.....

 Tante B

link 11.12.2016 17:26 
очень любопытно ююю
а как можно прослыть в словаре? кем бы то ни было, даже в одном, а?

 DRE

link 15.12.2016 9:12 
Попросил права редактора... Пока ничего...

 alk moderator

link 15.12.2016 9:14 
DRE - я Вам отвечу, подождите, пожалуйста

 ttimakina

link 15.12.2016 12:50 
Правильно будет редакторов выбирать путем голосования пользователей. Иначе можно потом такое получить...

 DRE

link 15.12.2016 12:59 
Правильнее было бы голосовать за правки, потому что не бывает непогрешимых редакторов.. но эта идея не нашла поддержки.

 ttimakina

link 15.12.2016 13:11 
Я уже свое мнение высказала - премодерация и привлечение редакторов. А их тщательно выбирать, опираясь не на амбиции и желания кандидатов, а на объективные факторы, в том числе, на голосование пользователей. И надо понимать, что бессмысленно рассчитывать на результаты работы "из добрых побуждений".

 juliedor

link 15.12.2016 19:34 
"И надо понимать, что бессмысленно рассчитывать на результаты работы "из добрых побуждений"."
Очень спорно. Сам проект мультитран начинался как некоммерческий.
Внесение терминов в словари - это по сути PR и реклама.
Статус "Модератор" - это выше, чем просто "засветиться" в словаре.
Тщеславие, Судари и Сударыни:) Очень хороший двигатель.
А про привлечение научных кругов к редактуре вполне реально:
1) Статусность ("тщеславие"), но нужно выдавать какую-нибудь бумагу-подтверждение 2) За роскошь иметь таких редакторов платит сам ВУЗ при формировании зарплаты. Это реалии сегодняшнего мира.
3) Альтруизм тоже имеет место быть.

Извините, надоело смотреть на ляпы (примеры, будет время, приведу).

И хотелось бы, чтобы в отношении внесенных пользователями переводов стояло ограничение ответственности: мультитран за их использование ответственности не несет или наподобие. Или хотя бы строка для заполнения по умолчанию, что авторские придумки вы используете на свой страх и риск.

Есть словари, отвечающие требованиям словарей (академические), а есть доморощенные догадки/переводы, не нашедшие еще или уже закрепления в академических словарях.
Такое ограничение ответственности поможет редакторам, которые правят "косые" переводы избежать споров на уровне: "но это же из мультитрана, а ничего, что это слово/термин внес Вася Пупкин под ником "пупок":)?! Или как?

P.S. Грузовика бы еще в отдельную рубрику или запретить вносить лексические единицы под своим ником. Он не свой труд же вносит, а нарушает АВТОРСКИЕ ПРАВА составителей/я словарей. Под этим предлогом и можно убрать в отдельную рубрику или в небытие. Он - техасец, бывший военный, с большим самомнением, упрямый, не очень вежливый, престарелый дед с испорченным возрастом характером (я так поняла из справок о нем). Поэтому сообщество обречено еще долго любоваться этими лексическими единицами.

 

You need to be logged in to post in the forum