DictionaryForumContacts

 Bogdan_Demeshko

link 6.10.2014 9:11 
Subject: ТРАДОС 2011 (2014) gen.
Собственно, вопрос по подсчету оным статистики, а точнее повторов. Есть пункт подсчета CROSS-FILE REPETITIONS, чем он отличается от просто REPETITIONS?
Читаю на сайте SDL:
"Report Cross-file Repetitions: When this option is selected, the repetition counts also include segments which occur in other files that are being analyzed in the same task. The analysis process counts the number of repetitions (identical segments that occur more than once) in each file." Тогда просто REPETITIONS это что?

 Aiduza

link 6.10.2014 9:37 
повторы в пределах одного анализируемого файла, а не группы файлов.

 Bogdan_Demeshko

link 6.10.2014 9:59 
Если бы у традосов все было так просто. И для каждого отдельного файла, и для всей кучи файлов есть и CROSS-FILE REPETITIONS и REPETITIONS. Может это просто какая-то фигня, типа HOMOGENITY в MEMOQ...

 glomurka

link 6.10.2014 10:02 
для каждого отдельного файла CROSS-FILE REPETITIONS это число сегментов этого отдельного файла, повторяющихся в других файлах. По-моему, так

 Эдуард Цой

link 6.10.2014 10:04 
а Totals - это сумма цифирь по отдельным файлам /Ваш К.О./

 AsIs

link 6.10.2014 10:18 
повторы в пределах одного анализируемого файла = REPETITIONS (как было сказан выше)
--------------
Если один и тот же сегмент встречается, скажем, в двух файлах, то в анализе одного из файлов этот сегмент будет как New, а в анализе другого - CROSS-FILE REPETITIONS
Сколько бы ни было файлов с повторами, первый анализируемый файл будет без CROSS-FILE REPETITIONS, ибо все сегменты в нем (если только они не внутренние повторы) считаются новыми. А уже если они повторяются в других файлах, то соответственно в статистике этих других файлов и будут отмечены как CROSS-FILE REPETITIONS

 AsIs

link 6.10.2014 10:20 

 Bogdan_Demeshko

link 6.10.2014 13:01 
Коллеги, спасибо! AsIs, отдельное спасибо, вот как раз этого не хватало для полного понимания. Но если снять галочку с подсчета CROSS-FILE REPETITIONS, а оставить только просто REPETITIONS, то на этом же примере будет просто 0 повторов???

 AsIs

link 6.10.2014 13:24 
Тогда просто эта строчка не показывает ничего.
На этом примере (с 2 файлами одинакового содержания по 6 слов) перед началом перевода статистика покажет 12 новых слов, поскольку перекрестные повторы вы приказали программе не считать, а друг для друга они внутренними повторами не являются, так как находятся в разных файлах. В памяти перевода еще нет. Что остается - только считать их новыми. То есть подсчет идет как будто не два файла за раз, а по файлу в два захода, как два отдельных проекта.
При повторном анализе двух этих файлов после перевода первых 6 слов (первого файла из двух), будет 12 слов 100%, так как перевод 6+6 уже в памяти.

 AsIs

link 6.10.2014 13:32 
Естественно, при отключении этой опции возможно искажение реальной ситуации. Поэтому одной из самых актуальных нужд в САТ во все времена была возможность склеивать сто файлов в один, с тем чтобы и повторы адекватно считались в тех КАТ, где нет межфайлового подсчета, а еще больше с тем чтобы эти повторы не только показывались в статистике, но и вставлялись в переводе...
Так что отключать не стоит...

 Эдуард Цой

link 6.10.2014 14:39 
1) Отключить, посчитать статистику для заказчика.
2) Включить обратно, для себя.
:)

 Bogdan_Demeshko

link 6.10.2014 16:47 
AsIs, Эдуард, спасибо. Хорошо, когда кратко, точно и по делу, очень ценю. Попробовал, все так и есть, в Вашем примере (AsIs), если убрать эту опцию, будет 0 повторений. Смысл этого всего лично для меня - реально оценить объем работы и срок, поэтому опцию теперь буду пользовать обязательно.
Вопрос решен, давайте закрывать тему. Спасибо.

 

You need to be logged in to post in the forum