Subject: ОФФ: наколдуйте мне умную прогу gen. Коллеги, кто-нибудь знает, существуют ли программы (или какие-нибудь макросы или неизведанные функции ворда) для подсчета частотности терминов в тексте? Например, "сквозные" термины по файлу. Очень надо! Часто приходится к проектам глоссарии составлять, было бы так удобно, аж до приятногоПризнательна |
awk, gawk, sed |
блин, чо за хрень опять с МТ???? ну, если мой секретный ответ никто другой не напишет, то тогда по секрету ссобщу. попытка запостить хоть что-нибудь номер 7 !!! |
techy1 это что? тайные приветствия масонов? натрикс, выйди из сумрака ))))) |
Макро можно нагуглить нужный или на технете - форуме мелкософта - поспрашивать. Наверняка такой либо есть, либо его можно написать. А вот это http://word.tips.net/T001833_Generating_a_Count_of_Word_Occurrences.html не оно? |
айб, бен, гим! :) |
Wolverine ну сложное же все -.- Rami88 а вот это попробую ) спасибо |
ну вот, я смотрю тут все умные уже разобрались между собой. мне можно обратно в сумрак идти спать с чистой совестью. крибле, крабле, бумс (чуть что, это не команда, просто колдунство, чтоб все получилось))) |
Попробовала макрос, но он только для латиницы, не считает кириллицу, а жаль, хорошо работает |
С кириллицей по жизни проблем много:( Могу порекомендовать только еще тут задать вопрос. А тем временем, может, и в этой ветке какой-нибудь гуру офиса отметится:) |
спасибо! будем искать |
во, нашла тут http://wordexpert.ru/page/makros-dlya-podscheta-chastoty-upominaemyx-slov пропустила файл через него, он мне выдал шайтан-текст, где возле каждого слова в скобочках его частотность: Информация (5) о (4) текущей (4) ориентации (23) модели (56) – это (13) углы (17) крена (28) и (168) тангажа (27) , вычисленные (3) с (49) помощью (3) встроенных (1) датчиков (17) ускорений (19) , угловых (7) скоростей (7) и (168) компаса (9) . Выглядит пугающе, но в принципе...... |
|
link 25.03.2014 23:17 |
Традос такое умеет 2007 точно умел в 2011 мне это ни разу не понадобилось, поэтому где и как это сделать -- сказать не могу |
В Студии это отдельным приложением идет. Покупать надо. В мемокУ есть Extract terms (в разделе Operations). Эта функция выделит из искомого массива (можно искать по файлу для перевода, можно по памяти, можно по livedocs) так называемые "кандидаты" (в термины). Мусора много, но если подкрутить настройки, можно уменьшить. Ну или потом лишние повыкидывать (Ctrl+D) |
check Sr Curioso link. it's worth while |
А будет ли оно ворсвайл, когда текст не на 100, а на 100000 слов, допустим? Не глюкнет? |
может глюкнуть, если все сейчас дружно бросятся проверять, но тут, скорее всего, таймаут наступит. Попробовал вставить первый том Мертвых душ с Lib.ru, 75 800 слов по статистике Word. Время обработки 117 секунд (по статистике сайта), слов, по мнению mt, 35 092. Самое популярное слово "и" встречается 1358 раз. |
Ммм, очень даже неплохо:) |
в Deja Vu есть такая функция "Лексикон" Загружаете в проект нужный файл и жмете кнопочку (там еще настройки есть, чтобы не только по словам, но и по фразам считало) |
разница в количестве слов объясняется, полагаю, учетом морфологии. Однако странности присутствуют. Разные формы слова "государство", например, всего дают 8 разных вариантов встречаемости, mt показывает только 5. Не понятно почему. |
Извините за офф... Пользователь ttimakina нужен. Вы здеся? =) Хочу вам ЛС написать так, чтобы вы готовы были его увидеть. Кас. MemSource. Отзовитесь, пожалуйста. Заранее спасибо! |
ооо, всем спасибо за инфу! только что зашла и увидела ответы, спасибоо! |
AsIs, я здесь! Пишите, плз, на <ник>@gmail.com |