Список форумов Kage Project Kage Project
 
  РегистрацияРегистрация  ВходВход
  Архив субтитровАрхив субтитров  ПоискПоиск  ЧаВоЧаВо  ПользователиПользователи
 Войти и проверить личные сообщенияВойти и проверить личные сообщения

Как преобразовать субтитры из формата SUB/IDX в SRT
На страницу 1, 2  След.
 
Начать новую тему   Ответить на тему    Список форумов Kage Project -> Техническая поддержка
Предыдущая тема :: Следующая тема 
Автор Сообщение
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Ср Окт 24, 2012 19:55 pm   Заголовок сообщения: Как преобразовать субтитры из формата SUB/IDX в SRT Ответить с цитатой

Я просто оставлю это здесь ©

Делюсь опытом, если вдруг кому понадобится...

Дано: есть DVD-рип с азиатским фильмом или аниме. Английские субтитры внешние, но растровые, в двух файлах *.SUB и *.IDX.

Вариант: есть DVD ISO, содержащий английские титры.

Требуется: распознать титры и получить нормальный файл *.SRT для последующего использования при переводе.

Неправильные решения: VideoSubFinder, SubRip, DVDSubEdit, Subresync

Правильное решение: использование специальной фичи редактора субтитров Subtitle Edit.

Редактор качать здесь: http://www.nikse.dk/

С Аегисабом он, разумеется, рядом не стоял, но у него есть одна очень приятная фича: распознавание растровых титров различных форматов. OCR работает вполне прилично. Разумеется, ручной контроль после распознавания никто не отменял.

Скриншот:


Последний раз редактировалось: Сб Окт 27, 2012 23:48 pm


[191.28 KB / Просмотров: 2662]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Сб Окт 27, 2012 20:55 pm   Ответить с цитатой

Самое правильное решение: Subrip+FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 21:35 pm   Ответить с цитатой

Ответ неверный.

Subrip — очень старая программа, которая часто фэйлит правильное построение растровых изображений титров на «пустом» фоне. Проверено на большом количестве наборов SUB/IDX и ISO-образов японских фильмов с английскими титрами.

К тому же, не совсем понятен механизм взаимодействия с FineReader. Во-первых, он является коммерческой программой. Его нужно либо купить, либо хакнуть (второе может не приветствоваться некоторыми участниками community). Во-вторых, он не делает на выходе SRT. В общем, костыли предлагать не надо.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 22:33 pm   Ответить с цитатой

Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Сб Окт 27, 2012 23:29 pm   Ответить с цитатой

Karsh:
Самый правильный ответ — SubResync. Very Happy Лучше проги для этого дела пока не встречал.


Очередной неверный ответ. У Subresync отсутствует автоматическое распознавание, придется каждый символ подтверждать:


[60.28 KB / Просмотров: 2224] [64.84 KB / Просмотров: 2120]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Karsh

Переводы



Зарегистрирован: 17.03.2012
Сообщения: 325
Откуда: Ленинград
СообщениеДобавлено: Сб Окт 27, 2012 23:56 pm   Ответить с цитатой

Pelikan
Subresync умеет сохранять в асс и без распознавания. Пара кликов, грузим аеги — и переводим. Дело нескольких секунд и не надо париться с OCR.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Посетить сайт автора Номер ICQ
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 0:12 am   Ответить с цитатой

Karsh
Да-да, в «кривых». Знаем, плавали... Очередной костыль. Для двухчасового фильма ASS-файл получается объемом несколько десятков мегабайт, а мой метод дает распознанный текст.

Subresync я применял для японских титров, распознать которые крайне тяжело (есть очень трудоемкий путь через Finereader):


[240.45 KB / Просмотров: 2349]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 0:25 am   Ответить с цитатой

Не, для японских титров лучше тайпист. Файнридер лажает чаще.

Pelikan:
часто фэйлит правильное построение растровых изображений титров на «пустом» фоне.

Примерчик можно?

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 8:19 am   Ответить с цитатой

Наверное, имеется в виду e.Typist? Это платная программа. Опять же — либо покупать (стоит сильно недешево), либо ломать.

Shur:
Примерчик можно?

Те «коллекции» BMP-файлов, где каждый третий был непонятно чем, я давно уже стер, воспроизводить их заново нет никакого желания.

Пример работы OCR SubRip'а c подгруженными матрицами:


[128.59 KB / Просмотров: 2290] [130.2 KB / Просмотров: 2153]
К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
KeeperRus

Переводы



Зарегистрирован: 16.08.2010
Сообщения: 1860

СообщениеДобавлено: Вс Окт 28, 2012 9:10 am   Ответить с цитатой

Pelikan
спасибо, пригодится.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист Отправить e-mail Посетить сайт автора
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 14:13 pm   Ответить с цитатой

Ок. Уговорил. DVDSubEdit + FineReader Laughing

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 16:43 pm   Ответить с цитатой

Shur
Увы. Sad DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте. Сколько раз экспортировал с помощью него английские титры в SRT — столько же раз получал плавающий нарастающий рассинхрон с последующей утомительной ручной подгонкой.

У FineReader'а есть вполне объяснимые проблемы с распознаванием иероглифических текстов на изображениях плотностью ниже 300 dpi, к которым относятся скриншоты.

***

По распознаванию растровых азиатских титров «наклевывается» тема использования того же Subtitle Edit, поскольку он умеет пользоваться API распознавалки MODI (Microsoft Office Digital Imaging).
Для этого должен быть установлен M$ Office 2003 или 2007, к нему — языковой пакет (language pack) нужного языка (японский, китайский, корейский).
В настройках распознавалки Subtitle Edit нужно выбрать MODI вместо Tesseract и попробовать распознать титры.

О результатах напишу.

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 18:32 pm   Ответить с цитатой

Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"

К началу
Pelikan

Переводы



Зарегистрирован: 05.03.2006
Сообщения: 137
Откуда: Москва
СообщениеДобавлено: Вс Окт 28, 2012 19:32 pm   Ответить с цитатой

Shur:
Pelikan:
DVDSubEdit я сразу поставил в «отказной» список, потому что он сильно врет с таймингом при экспорте.

Галка в настройках "use drop-frame time code"


Попробую.

А почему этот режим не выставлен по умолчанию?

К началу
Посмотреть профиль Отправить личное сообщение Добавить в игнор-лист
Shur
Гость





СообщениеДобавлено: Вс Окт 28, 2012 20:48 pm   Ответить с цитатой

Автор француз

К началу
Показать сообщения:   
Начать новую тему   Ответить на тему ‹xЪЅVIoЫF>[ївeЂ: ‹ўд-6ЙAЃ h ¤poAPpJL№Ѓ¤¬ЁЛ+Њ[.PфJЙўCkQІЈP w†”dI•\ Єѓfб[жыж-#pѕ+Ы’Аљ”[ dУ(Ы"2± 8Ї,CУLЊ fhAED|Ўр’¦ Є)ыѕ€lщIл¶в»ыія‚ л"2l їК»чЯРDU.и…]ес6Пл…’ѕ№і]Ъ,¶uЊwфЭ]^AsfЏысЂґб‚$з]Т„Пе2†gћу«ЃАЙфЬL]ё¦;^ХJЭйbi]¶Ьэ»»э-zЫ‹/ЈA;ј‚>iµўдґ2‡В*Т<Ј\™a-p\¶Sуd—љLЗЦКШц-Щ4‘фG8 MrF] цай—_ГЗPљ8R<а–Рэkѓaцвwз (/pЉфhћzCMyD~«ИS.\З4№о‹…йТс4м‰ІЇfdІЗnПњTdМ,ЅъячЗќЁ•џ№%ЩMҐЈ—Ћlшwґ«ЋЙTDTZЬЗХб”j€Я°y‘НзBbв€юЛЉ‰й$зІTl2oЄa—ETD dИQMҐb;Аљ?рШЖ&3qSњН!KIЯJKЧ¤Ь5|sM- ,TЌ0U°e ‹иeХrзх¬†c/жбнтП±ЄЉeґ`и4G­Z”„ьШt^ПУіU1€"lрїчpPхlРeУЗы?Т;Лhћc¶ђ1нКљ6Y_3ќВgМ¦,Ь2S_GIt6ЊчЖ|ъШ¤uhМЃОЁЩ.гAP1ьјг2>ьзй"ЗЪg¬ѕг№—бF­яьюоэy?%гБC`и2;ђЄ€hѓGТСЁ%с0КJЈАeЛ$З‡ЅAвuBўцpD ф)В&iќЯ$ѕ±р[%»E‡\ ac•ї‰¤ЯГ¤u“µтKШ; !љ„¤счыaэ™4 “њ†Т ‡ЭыH‹”CrB‹xЇјЉљЬї8ќ­l4пѓрSЩы d;Hъ©Ы“UЯУп­nЬ‹Y7z_]ЛqHI0l·@Pw©x…>&°=)ґ. ‰Ўя®Ьы¬Б,K¦VЖ :mж¦ам@LЎyПjЃc(еr+RяhД ~/‚.9Ќ†QЪzбeЬЈ1ГЁ;КЄл212lF—L¬G›6!Ќ?Ј%jҐxµВц0NТр„A“Д·С:o…ќ«;Иџђd.љ@ъ „oWKч“ёќDэФГExЦAыЪIwVoF‰хeњzHUM­DЅЮ(ZbбжNљ4гp±AОЭ–кёх¬‘I ©¦ґL‰fо™SГЦ@©ГЮх‹ЄоЗХj5ЦТ%Ї:‡Ђ>RhС7йж2{фГ“'мQлlw~ЂЈ$к^Qг…<їµ= _}±с&d—@Яё{АпТЅ§Я.ќµ;щЬ@6¬­-Ќ`J§8ZќнTЛ¤яНї†Јг