Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Автор
Страницы
Управление

Сказания о локализации — и не только

Еще один блог ГП

Подписаться на RSS  |   На главную

Про память

Людей незаменимых нет, и все же

Ушедшего мы заменить не можем.

(c) Мирза Шафи Вазех

Память, не компьютерная, человеческая — и радость наша, и наказание.

Второй день смутное ощущение, что в мире стало меньше света. Как будто перечитываешь ту часть нескончаемой Поттерианы, где гибнет Дамблдор, только с одним отличием — все по-настоящему. Вспоминается давний вечерний разговор, совмещенный с разглядыванием солнца, заходящего в воды залива:

— Ты не можешь уйти так, чтобы все не развалилось. Твои соратники профессионалы и хорошие люди, но они не ты. Это как часы — все работает какое-то время, но без часовщика рано или поздно идет вразнос.

— Не думаю. Если так, это значило бы, что я никого ничему не научил.

Хоть бы он снова оказался прав.

R.I.P., Steve.


7 октября 2011 Andrew | Пока нет комментариев


Про шум

Неизвестным виртуозам словаря и Cut/Paste посвящается…

Попал на днях в мою прозекторскую комплект материалов еще одной солидной компании, репутацию которой в прошлом году подпортил небезызвестный «боевой червь». Червь дал неплохо заработать некоторым вирусным аналитикам, но для компании это был чистый форс-мажор, так что ее винить не в чем, разве что в типичной корпоративной неповоротливости.

Другое дело — фирменная документация на изделия, которые компания продает за очень неплохие деньги. Открываем, ужасаемся, закрываем. Задумываемся — точно ли это официальная документация? Ну да, вот она, выложена на сайте производителя, хоть и отстает от «железа» лет на пять. Пробуем прочесть снова… никак. Дикая смесь подстрочника, непонимания даже основных принципов работы и небрежности.

Один пример, табличка поддержки стандартов устройством (кстати, речь о компьютерном сетевом оборудовании):

Свежий взгляд на стандарты

Свежий взгляд на стандарты

Почему специалисты пытаются читать документацию в оригинале и морщатся при слове «перевод»? Да вот поэтому! А что еще им остается читать? «Уровень шума» в оригинале — «Noise emission». Про приведенный здесь же строкой ниже «говорящий» номер стандарта я уже не вспоминаю. Но, черт возьми, это же собственная документация производителя! В ней-то можно было не писать чушь. Возвращаю заказчику аудита вердикт «к употреблению непригодно», в очередной раз задумываюсь о судьбах мира.


23 мая 2011 Andrew | Пока нет комментариев


Лицо компании

Постепенно прихожу к мысли о том, что нетленные образцы творчества лохализаторов все-таки надо фиксировать, чтобы не лезть за аргументами в Сеть, пытаясь проиллюстрировать свои мысли менеджерам очередного проекта, уверенным что «тут все уже нормально, надо только немножко проверить орфографию и доперевести недостающее».

Сегодня у нас в меню сайт одной приличной безо всяких кавычек компании, выпускающей вполне достойные продукты. Компания давно работает в России, объемы продаж можно исчислять в сотнях тысяч устройств, вроде бы все солидно. Итак, пытаемся узнать, где же их можно приобрести:
shopsМагазины в Russian Federation — это попадание в десятку, конечно, но где у нас находится город -All- не знает, боюсь, и сам вездесущий ВВП. Впрочем, выше всего информацию оценят жители старинных русских городов — «Н.Новгорода» и «Томбова». Продавцы подчеркнуто мобильных телефонов тоже будут рады  упоминанию на этой страничке, пускай адреса/телефоны и озаглавлены по-английски. А теперь вопрос на засыпку — каким был бюджет локализации этого ресурса, и в какие сроки/какими силами все делалось?


21 апреля 2011 Andrew | 8 комментариев


Новый Офис — старые грабли

Вышел свежий, с пылу с жару — MS Office 2010. Как водится, в нем масса инноваций (читай — к нужным функциям теперь придется добираться через еще один слой красивостей). В кои-то веки он более-менее сносно ставится обновлением на существующий Office 2007, не вынуждая отдельно спасать файлы шаблонов и автозамены. Работает в меру стабильно, некоторые новинки радуют, некоторые удивляют, но в сумме все выглядит терпимо. Впрочем, интересно будет посмотреть, как кошки отреагируют на новую редакцию офисных форматов, которые в MS тихой сапой подкручивают время от времени, ничего не упоминая о том в Release Notes.

А вот словари от предыдущего офиса игнорируются совершенно. Так что если кто-то ставил англоязычную/европейскую версию 2007, а затем отдельно покупал словари для других языков (как я), то можно начинать готовить деньги. Только начинать — потому что в продаже их еще нет. Если не ошибаюсь, то комплект словарей (Proofing Tools) в России продавался только в составе Multi-Language Pack 2007  по скромной цене порядка 10к рублей.  Прогресс прогрессом, но в глубине души гложет любопытство: неужели с прошлой версии в русском языке, его орфографии и грамматике произошли какие-то фундаментальные изменения? Или в Редмонде просто опять хотят денег?


18 мая 2010 Andrew | 4 комментария


Про экономию

Довелось заняться аудитом локализационных материалов. Интерфейсные строки в файлах XML, база ТМ, все как у людей, но… Начинаем читать. Есть, среди прочих, строка «Отключить». Кошка, не раздумывая, подставляет из базы «Disconnect». Подставляет решительно, во все 30 вхождений строки — 100% совпадение как-никак. И плевать ей, что первая строка красовалась на кнопке подключения к серверу, а 5 из 29 последующих — на кнопке отключения элемента в списке, которое на самом деле никакой не Disconnect, а вовсе даже Remove, а в паре мест и попросту Disable. Что в результате? Сборка с ерундой в интерфейсе, эта же чушь в документации, масса замечаний от тестеров, список исправлений на доработку, новый цикл сборки-тестирования. Естественно, не из-за одной строки — при подобном подходе на каждую тысячу строк таких найдется 50-70, если не больше. И вот вроде бы  сотни людей при деле, трудятся, не покладая клавиатур и мышей, а результат на выходе — гора в муках рожает мышь. Сэкономили?


22 марта 2010 Andrew | 9 комментариев


Про эффект бумеранга

Ну вот, попалась наглядная иллюстрация к тому, о чем сам же писал вот здесь. Крупная компания, известный разработчик ПО, предлагающий отличные продукты. Начинаем читать независимый обзор в сравнении с конкурентами — и что? Прекрасные отзывы о функциональности, стабильности, возможностях в завершение сдобрены вежливым «а вот документация могла бы быть и получше». Да, несомненно могла бы. Но этой задаче нужно уделять внимание и ресурсы. Как бы ни хотелось сэкономить здесь и сейчас на копеечных повторах, нужно сдержать себя — и сэкономить в перспективе: на поддержке, затратах труда при разработке и средств при продвижении. Для продуктов, выходящих на другом языке, локализация должна включаться в планы с приоритетом не меньшим, чем собственно разработка — вот чему нашим разработчикам еще нужно долго учиться. Хочется надеяться, что рынок даст им это время.


18 января 2010 Andrew | 4 комментария


Про хороший аппетит

Съесть-то он съест, да кто ж ему даст?

Компания ABBYY, любимая многими за Lingvo и FineReader, начинает продажи нового продукта — ABBYY Aligner.  Эта разработка, по описанию создателей:

выравнивает параллельные тексты на 10 языках и работает с любыми из 90 направлений перевода для следующих языков: английский, немецкий, французский, испанский, итальянский, польский, португальский, турецкий, украинский, русский.

В ABBYY Aligner реализован пакетный режим обработки файлов – режим, позволяющий поставить в очередь большое количество документов, которые будут выравниваться автоматически без участия пользователя.

Программа ABBYY Aligner имеет простой и интуитивно понятный интерфейс, который позволяет разобраться с основными элементами в самый короткий срок и делает работу с ABBYY Aligner комфортной и эффективной.

Список поддерживаемых форматов: DOC, DOCX, TXT, RTF, PDF, HTML, PPT, PPTX, XLS, XLSX.

Результат можно экспортировать в RTF или TMX. Другими словами, делает она примерно то же, что и  все прочие утилиты выравнивания,  но соображать должна чуть получше — все же за ее фасадом скрыт изрядный опыт внутренних разработок ABBYY.  Кроме того, заявлен дружественный интерфейс и расширенные возможности редактирования после совмещения. Насколько все это работоспособно, нужно будет еще посмотреть, ну а пока программа предлагается для ознакомления и продается, причем на довольно жестких условиях:

Стоимость лицензии зависит от двух параметров:
* от срока, в течение которого вы хотите использовать программу
* от объема баз Translation Memory, которые вы планируете получить при помощи программы. Объем баз TM выражается в количестве экспортируемых из программы строк выровненных параллельных текстов*.

Минимальная стоимость лицензии на минимальный объем и срок (5000 строк / 3 месяца) – 5 750 рублей.

Специально протер глаза и перечитал еще раз. Увы, зрение не подводит, 5 750  рублей минимум предлагается отдать за 3 месяца или 5000 строк, экспортированных чудо-недокошкой. Да, либо в ABBYY стало совсем туго с деньгами, либо в цену программы включена стоимость всех разработок ABBYY с момента основания.

Спору нет, внутренние разработки могут и должны приносить дополнительную прибыль. Раз уж при создании основных продуктов появились наработки, позволяющие выпустить такую утилиту, почему бы ее не продавать? Вот только красная цена ей 500 рублей, в версии Deluxe с комплектом рюшечек для бюро и крупных заказчиков можно дотянуть ее до 1500 — за бессрочную лицензию и бесплатные обновления версий с номером «после точки». Но старт от такой отметки? Остается только порадоваться за хороший аппетит маркетологов ABBYY и пожелать им всяческих успехов. Или им кто-то забыл сказать о существовании WinAlign, Across, SDLX, DejaVu?


13 ноября 2009 Andrew | 18 комментариев


Про инновации

— Что же из этого следует?— Следует жить,
шить сарафаны и легкие платья из ситца.
— Вы полагаете, все это будет носиться?
— Я полагаю,что все это следует шить.

Нет-нет, это не обзор новой кошки. И даже не список граблей, щедро разложенных на входе для всех желающих перейти на новую версию. Просто рефлексия по поводу знакомства с новой версией известного инструмента — вдруг кому-то сэкономит минуту-другую. Но обо всем по порядку.

Новую версию SDL Studio 2009 ждали. Ее анонсировали задолго до выхода, на форумах ее хвалили и ругали еще не видя в глаза, но все равно было интересно — а что получится. Список изменений куда длиннее списка того, что осталось нетронутым, так что это фактически принципиально новый продукт. Самый первый блин вышел по пословице, но после SP1 благоприятных отзывов стало больше. Благодаря одной молодой и подающей надежды отечественной компании приобрести/обновить продукцию SDL стало возможно по вменяемой цене, так что наступила пора знакомиться.

В комплект издания Freelancer входят: (барабанная дробь) SDL Trados Studio 2009, SDL Multiterm Desktop, SDL Trados 2007 Suite. Последнее немаловажно для тех, у кого уже накоплен багаж переводов. Во-первых, перейти сразу на новую кошку получится не у каждого, а работать надо. Во-вторых, конвертировать старые залежи файлов и ТМ без него в новый формат просто не удастся. Сначала в SDL пугали тем, что лицензия на Suite 2007 будет ограниченной по сроку, потом чуток одумались, в общем, сейчас она выдается без ограничений по времени. При установке версии Freelance Studio 2009 можно выбирать до пяти рабочих языков и лучше отнестись к этому выбору серьезно — потом изменить его без переустановки не получится. Еще один забавный момент — в XXI веке передовой продукт SDL не позволяет выбрать каталог, в который его следует установить. Во всяком случае, процедура установки напрямую такой выбор не предлагает, хотя еще предыдущая версия вполне поддерживала подобное вольнодумство.  Активация обеих версий — совершенно отдельное удовольствие, но хотя бы знакомое, в этой процедуре никаких изменений не произошло. Жаль, но файл лицензии сейчас использовать уже не дают, если не взять техподдержку за горло. Он, между тем, был гораздо удобнее действующей сейчас методики.

Предыдущую версию Studio, кстати, нужно ставить первой. Затем необходимо хотя бы раз зайти в Workbench и создать идентификатор пользователя. Иначе первая же попытка перевести свои базы ТМ в новый формат закончится вот таким сообщением:

capture2 Сам перенос данных проходит без особых плясок с бубном, импортируются и базы Trados, и SDLX, и TMX 1.4b, и даже текстовые файлы (последние на практике не проверял). Однако прозрачности в этот процесс добавить не помешало бы. Вот, к примеру, стандартное сообщение об успешном импорте базы: capture5 И вроде бы все хорошо, но где, черт возьми, мне теперь искать еще 124 записи, 10% базы, в которой каждый сегмент полит слезами и потом? Какие именно сегменты оказались недостойными войти в прекрасный новый мир? Почему? Ответом на эти вопросы новая кошка себя не утруждает, видимо, не царское это дело. Угадать, на какой базе потеряются при импорте сегменты, не получится — явление совершенно спонтанное. Есть мелкие базы, которые спокойно импортируются до последней буквы, есть крупные. И в то же время на половине баз из любой случайной выборки возникают вот эти потери. Надеюсь, дело в алгоритмах анализа совпадений, а не в кривизне фильтров импорта.

Странно, но в новой разработке нет собственного средства для составления баз из накопленных переводов, предлагается использовать для этой цели старый добрый WinAlign или SDL Align. Также не получится использовать одну базу в двух направлениях: если у вас база для перевода с английского языка на русский, сразу подключить ее для перевода с русского на английский новая система не даст.

Надо отметить, что некоторые подводные камни, подстерегающие счастливых пользователей Studio 2009, как и пути обхода, в SDL заботливо описали в руководстве по миграции (каких-то 248 страниц), но его можно прочесть только после покупки продукта, это описание на сайте производителя для свободной загрузки не предлагается. Напрасно, можно было серьезно сэкономить время и нервы техподдержке, ну да это их дело.

В самом интерфейсе Studio 2009 ориентироваться довольно легко, если сразу забыть о привычках и рефлексах, накопленных за время работы с предыдущими версиями. Это другой продукт, в чем-то более сложный, в чем-то — упрощенный, есть в нем и аспекты, напоминающие о ближайших конкурентах (DV, Across). Знакомство с новинкой облегчают вводные учебные описания. Некоторые подразумевают использование проекта-образца, входящего в стандартную установку. Так вот, здесь некоторых тоже поджидает сельскохозяйственный инвентарь. Если на этапе установки вы не выбрали рабочими языками японский, французский и немецкий, то попытка открыть любой файл из проекта (хоть для перевода, хоть для просмотра) закончится вот этим: capture

Маркетоидный маразм, скажете вы? Ничего подобного, четкое сегментирование рынка, ответят в SDL.

Бог с ним, переходим к проектам. SDL Studio 2009 вся вертится вокруг проектов, которые делятся на пакеты. Мысль здравая, в пакет входит все необходимое (исходник, задание, базы, метаданные), но вот их разнообразие удивляет — пакеты для перевода, для проверки, для отправки и возврата, для.. через пять минут от них начинает рябить в глазах. Идея хороша, спору нет, но зачем плодить столько разновидностей? Внутри у них ведь одно и то же — разница по сути лишь в задании, которое назначается исполнителю. Возможно, впрочем, что хотя бы менеджерам БП все это пригодится. Проекты можно удалять из списка, при этом на диске они остаются. Это удобно, пожалуй, позволяет не тревожиться особо насчет неосторожных движений в ходе работы.

Создать новый проект можно только в пустой папке — тоже мысль здравая, но предупреждать об этом стоит заранее, при выборе места, а не после выбора, вот таким образом:

capture7Да и возможность очистить выбранную папку под проект тоже не помешала бы — для ее реализации вовсе не  нужно миллионных вложений в R&D.

Ладно, пробуем создать проект. Беру оригинал переведенного давным-давно файла (Ru->En) из личных закромов, к нему конвертированную парой минут раньше его же родную базу и…

capture8

По-моему, несовпадения в пределах 20% вполне можно списать на расхождения в правилах сегментации и анализа, это приемлемо. 11% от всего объема — нормальный и даже неплохой показатель для ненастроенной кошки, которой дали первое задание. Но вот количество повторов озадачивает. Скрин выше — это результат для пары Ru-En(US). А вот для пары Ru-En(UK) на том же файле кошка выдает такой анализ:

capture9

Вот это уже ставит в тупик. Товарищи из SDL, в нашем деле за неточную статистику бьют канделябром вообще-то!  Понятно, что причина в базе — если ее отключить, статистика становится идентичной, но ведь обычно материал анализируется как раз с базами накопленных переводов. В общем, этот аспект в новой кошке требует как минимум внимательного пригляда и перепроверки.

Смутило настойчивое кошкино стремление помечать все сегменты как завершенные на выходе из любого режима. Из редактуры — как отредактированные, из sign-off — как утвержденные. А если я не успел за один раз проверить весь документ? Они ведь и большими бывают, знаете ли.

Вот к чему нет особых претензий, так это собственно к интерфейсу для перевода. Пускай он цельнотянутый из DV, где почти все это было еще несколько лет назад, но автоподстановка, автопоиск, динамическое распространение переводов на повторы — это очень удобно. Импорт сложных файлов, работа с тегами, таблицами, списками, отражение структуры документа — все это субъективно стало делать значительно легче. Возможность переключиться в полноэкранный режим тоже не лишняя. Real-time preview, конечно, работает через пень-колоду, а на выходном файле чаще не работает вовсе, но это уже не только кошкина вина — какие файлы приходят иногда в работу, знают все, кому доводилось заниматься переводом. Когда все действует как задумано, работать комфортно, а информация действительно отображается удобно, хоть и заставляет пожелать себе какой-нибудь широкоэкранный монитор с диагональю дюймов так на 40-50. Как следствие, в интерфейсе мне лично очень не хватает возможности масштабировать текст в ячейках исходника/перевода. Скорее всего, где-то в кошке эта функция закопана, но интуитивно найти ее сразу не получилось.

Еще интересный момент — в процессе работы кошка по умолчанию вносит новые сегменты в ТМ текущего проекта, не трогая исходную (основную) память. После завершения проекта можно решить, куда отправлять новые сегменты. Основная ТМ при этом не замусоривается промежуточными и неудачными вариантами. Или все равно засоряется, но ощутимо меньше. 🙂

Работает SP1 в меру стабильно, космических скоростей не показывая, но все успевая. Конечно, не обходится без любимого фокуса SDL, маловразумительных сообщений движка .Net об ошибках, особенно на сложных файлах HTML:

capture10После сообщения проблемный файл, как правило, закрывается, и переводить его кошка не дает. Очевидно, нужно подкручивать настройки.

Экспорт заслужил похвалу — в кои-то веки изделие SDL без особых настроек и бубнотрясения не убивает в выходном файле коды, перекрестные ссылки, поля, не сдвигает картинки и не уносит подписи к ним на пару глав вперед/назад. Это определенно прогресс, тут ставлю плюсик без колебаний, хотя наверняка будут случаи, где грабли все-таки покажутся на свет.

Наконец, добираемся непосредственно к той части комплекта, что отвечает за локализацию. Суровые парни из SDL решили включить в комплект Studio целую новую программу — Passolo 8, в редакции Essential, то есть обрезав ей предварительно все, что только можно. Открываем что-нибудь из старых запасов:

capture12Ну что же, накладки возможны, совсем уж безоблачной жизни никто и не ожидал. Пробуем дальше:

capture11

Хм… парни в SDL, вероятно, очень добросовестно подходят к процессу перевода и ждут того же от каждого менеджера проекта. Теперь, чтобы разослать материал на перевод, например, в трех языковых направлениях им нужно будет сделать не один пакет .tbu, а три .lpu — со всеми дальнейшими радостями их объединения, когда переводы будут готовы. Иначе переводчики просто не смогут открыть пакет. А ведь направлений перевода может быть и больше. Определенно не самая лучшая идея, ведь менеджерам хватает головной боли и без жонглирования разными вариациями пакетов с одним и тем же. Ладно, идем дальше, открываем .lpu:capture13Вот на этом окошке мне, признаюсь, выдержка изменила, и в SDL отправилось письмо с кратенькой характеристикой их умственных способностей. Пускай формат в новой версии программы мог измениться, пускай его надо конвертировать, но зачем конвертировать тот же самый файл? Почему бы не дать кнопочку для надругательства над его копией? И, наконец, если это уж совсем невозможно, почему бы не разблокировать функцию экспорта для сохранения в формат более ранних версий? Почему выбор Export в меню File служит только для вывода сообщения: «The function ‘Export…’ is only supported by the SDL Passolo Professional or Team Edition»??

Я понимаю, что парни в SDL, как и все прочие, хотят денег. Ну так пусть заработают их функционалом, а не занимаются шантажом пользователей. Я уж не говорю о том, что процентов 90 этих самых пользователей (и разработчиков ПО, между прочим) как раз и сидят на старых версиях их же приложений и как-то не горят желанием в одночасье переходить на новые. Значит, полная обратная совместимость  с ними — не роскошь, а обязательное условие. Если для перехода на новое ПО придется перетаскивать на него же всех контрагентов, выкидывать в мусор все свои многолетние наработки либо начинать их копить с полного нуля…. то этому ПО нужно быть значительно более отлаженным и продуманным, чем предлагаемый SDL комплект. По локализационной составляющей категорический незачет — без всемерной поддержки БП к использованию непригодно. Причем непригодно не из-за дефектности продукта (Passolo — программа сама по себе вполне нормальная), а по ущербности и недальновидности маркетоидных ограничений, навязанных пользователю. Видимо, кризис еще далеко не все прочистил в некоторых мозгах.

В сухом остатке наблюдаем довольно интересную концепцию, впечатление от которой изрядно портят мелкие недоделки в реализации и глупейшие маркетинговые ограничения. Шероховатости в программном коде, надеюсь, со временем вычистят (ждем SP2?). Когда уволят гениев из отдела маркетинга — до разорения SDL или уже после, вместе со всеми — еще один занимательный вопрос. Он даст ответ на другой — будут ли решения SDL широко использоваться в следующие 5-10 лет. Пока что, как ни парадоксально, Studio 2009 вполне работоспособна на простых задачах, а субъективные впечатления от нее по большей части положительные. Использовать ее в работе я, скорее всего, буду и дальше. Вместе с тем, производитель очень предусмотрительно поступил, включив в комплект и предыдущую версию (Suite), она там совершенно точно не лишняя.

Сама попытка слить воедино разрозненный зоопарк программ и утилиток достойна поддержки и одобрения. Получилось ли? Время покажет. Пока начало выглядит многообещающим, несмотря на избыток шероховатостей и упущений. Innovation delivered. Осталась мелочь — только довести эту новацию до применимости реальными людьми, а не сферическими переводчиками в вакууме.


12 ноября 2009 Andrew | 11 комментариев


О титанах

Пришел на перевод комплект внутренних документов одной крупной и солидной компании. Дирекция, аналитики, архитекторы, инженеры, эксперты, программисты, дизайнеры… десятки и сотни серьезных профессионалов.

А самый длинный список умений и обязанностей, как всегда, у системного администратора. 🙂


7 октября 2009 Andrew | 2 комментария


Ясность мысли

Из сравнительно недавнего:

Результатом (и целью) процесса выполнения действий предварительной подготовки должен стать единственный результат, объединяющий все дампы исходных микросхем данной конфигурации флэш-накопителя, в соответствие с законом, определенным примененной последовательностью методов предварительной подготовки.

Автор, естественно, программист. И уверен, что «тут все в порядке». Ищу ближайшую стену.


14 сентября 2009 Andrew | 14 комментариев



Страница 2 из 3123