Архив - *.txt или *.doc?

Any discussions other than spam

Unread postby Saizo (архив) » 05 Mar 2005, 16:25

[quote]Не сложно, если надо выделить одну фразу. А теперь просто представь сколько уйдет времени, чтобы обработать больше 1000 страниц.[/quote]Что именно нужно сделать? Обработать сноски? Опиши что конкретно нужно с этими 1000 страниц делать, и я постараюсь накатать для этого дела макрос.



[quote]Можно. Но для подсчета страниц я собираю все в один файл. Мне придется делать двойную работу.[/quote]Можно намного проще. Сначала определяешь общий объем файлов с чистым текстом в байтах, а затем делишь этот объем на среднее количество символов на странице (у меня для 12го Times New Roman получилось 3840 симв/стр).



[quote]Я не против txt (и я уже поняла, что большинство именно за этот формат). Но хотелось бы слышать конкретные предложения по поводу ускорения процесса, а не фразы типа "ничуть не сложнее", "переводчику лень текст форматировать"...[/quote]Для более конкретных предложений нужно более подробное описание стоящих проблем. ^_-
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 05 Mar 2005, 16:51

[quote name='Saizo' date='5 March 2005']Опиши что конкретно нужно...

[right][post="70949"]<{POST_SNAPBACK}>[/post][/right][/quote]

Ок.

Есть то, что мне присылают (ну или я наперевела :victory: ). Это либо док, либо уже оформленный shtml документ (ну почти, я меняю там две строчки).

В этих документах могут быть:

- сноски

- заголовки

- стихи или текст в две колонки

- выделения текста (на это совершенно безболезненно можно забить, что и предлагаю сделать. В конце концов кому важны курсивы и т.п. будут читать html-версию.)

Сноски хотелось сносить *^_^* в конец (наверно).

Заголовки каким-то образом выделить (пополам как).

Вверху вставлять предупреждалку, если она есть.





Двух колоночных бяк очень мало. Проблема в том, что надо же [i]посмотреть[/i] , что их нет!!!





Да, я сразу хочу добавить (во избежание). Мне бы не хотелось нагружать этим наших дорогих переводчиков - пусть они лучше переведут еще чего :-n
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 05 Mar 2005, 17:30

Предлагаю такой алгоритм работы: Текст открывается Word'ом, и на него по очереди натравливается макросы. Их три.



Первый ищет все сноски и раскрывает их прямо в тексте в квадратных скобках, например так:

========было=============

..........................

жщфы фыд ь влджа[b][u]1[/u][/b] улоау

..........................



------------------

1 hhhg sjahdas



=========стало============

..........................

жщфы фыд ь влджа [hhhg sjahdas] улоау

..........................

=========================



Второй ищет текст в две колонки, и если находит - начинает сильно ругаться. (как искать стихи, и что с ними потом делать мне непонятно)



Третий сохраняет секст в виде последовательности TXT-файлов. Разделителями служат абзацы со стилем "Заголовок 1".



Автоматически выделять заголовки если они не помечены вряд ли возможно. Разве что могу еще накатать макрос для автопометки абзацев вида "chapter ...." или что-то в этом роде...



Такой набор инструментов будет тебе удобен? Какие еще будут соображения?
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 05 Mar 2005, 17:37

[quote name='Saizo' date='5 March 2005']Такой набор инструментов будет тебе удобен?

[right][post="70953"]<{POST_SNAPBACK}>[/post][/right][/quote]

Если это док, то да. А что делать если мне присылают shtml?

Cheb, Troll, вы переводите в Ворде? Вы сможете присылать такие док-файлы?





[quote name='Saizo' date='5 March 2005']Третий сохраняет [b]секст[/b]

[right][post="70953"]<{POST_SNAPBACK}>[/post][/right][/quote]

Лишний раз Сайзо подтвердил, что он злостный хентайщик! Описочка по Фрейду!!! :victory: *^_^* :-n
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 05 Mar 2005, 17:53

[quote]а затем делишь этот объем на среднее количество символов на странице (у меня для 12го Times New Roman получилось 3840 симв/стр).[/quote]

Нет, уважаемый, такой способ не подходит. Страница - [b]стандартная[/b] страница - это ровно 1750 символов [i]без учёта пробелов[/i], я Лане уже об этом писал. А для такого подсчёта нужен Ворд (или любая другая программа, которая умеет).



[quote]Cheb, Troll, вы переводите в Ворде?[/quote]

За Тролля не скажу, а я - в Ворде. Но сам с этими макросами никогда дела не имел, и не собираюсь.

[i]Сноски[/i] в Ворде никогда не делаю - помечаю просто цифирьками в скобках, а потом конвертирую в ссылки уже при переносе на html форму.
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 05 Mar 2005, 18:39

[quote name='Cheb' date='5 March 2005']Но сам с этими макросами никогда дела не имел, и не собираюсь.

[right][post="70957"]<{POST_SNAPBACK}>[/post][/right][/quote]

Это я возьму на себя.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 05 Mar 2005, 21:39

[quote]Нет, уважаемый, такой способ не подходит. Страница - стандартная страница -это ровно 1750 символов без учёта пробелов, я Лане уже об этом писал. А для такого подсчёта нужен Ворд (или любая другая программа, которая умеет).[/quote] Для TXT отдельная программа подсчета - 5 минут в любом языке программирования. Так что если кому надо, только скажите.



Кстати, мне (как и многим другим наверное) объем текста в байтах гораздо привычнее и информативнее чем объем в страницах (который все равно мысленно транслируется в байты). Среднее отношение (пробелы+служ.символы)/знач.символы для текстовых файлов отличается не сильно. Клинические случаи с половиной пробелов - редкость. Так что я за простое указание размера несжатого текста (хотя от указания еще и количества страниц большого вреда тоже не вижу).



[quote]Сноски в Ворде никогда не делаю - помечаю просто цифирьками в скобках, а потом конвертирую в ссылки уже при переносе на html форму.[/quote]Такая мысль возникла: в случае большой сноски разворачивать ее прямо в тексте будет некрасиво. Может лучше группировать их в конце главы, а разворачивать только маленькие (меньше 100 символов, скажем)? Или просто все переносить в конец...



[quote]Но сам с этими макросами никогда дела не имел, и не собираюсь.[/quote]Лана, если каждый переводчик будет слать тебе результаты своей работы как ему бог на душу положит, то ты в работе просто захлебнешься. Нет, я все понимаю: перевод - дело добровольное, а переводчик существо капризное. Но. Если число переводчиков вырастет.... Может имеет смысл принять меры зарание?



Например, можно сделать так: Все фанфики поступают тебе в каком-то одном формате, причем касательно сносок, разделений на абзацы и главы и пр.важных элементов оформления существуют определенные договоренности. Тогда процесс HTML-верстки можно будет полностью автоматизировать. Если кто хочет верстать страницу сам (добавить иллюстрации и пр...) - флаг в руки (хотя определенные нормы должны соблюдаться, дабы не нарушить стилевое единство сайта). Никаких неудобств переводчикам это не доставит (разве только привычкам), а тебя разгрузит. Кончно на серьезных фанфик-ресурсах автоматизировано вообще все что только можно, но для начала и это лучше чем ничего...



[quote]Лишний раз Сайзо подтвердил, что он злостный хентайщик! Описочка по Фрейду!!![/quote]Не надо ля-ля! Это не описка, а опечатка - ими не Фрейд а теория вероятности занимается.... Хм. Другая бы и не заметила, а у Ланы такое бурное проявление восторга... Хммммм.... (тоном Винипуха): Это "Ж" неспроста! :victory:
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 06 Mar 2005, 09:49

[quote name='Saizo' date='5 March 2005']Такая мысль возникла: в случае большой сноски разворачивать ее прямо в тексте будет некрасиво. Может лучше группировать их в конце главы, а разворачивать только маленькие (меньше 100 символов, скажем)? Или просто все переносить в конец...

[right][post="70981"]<{POST_SNAPBACK}>[/post][/right][/quote]

Наверно лучше тогда все переносить в конец главы.



Насчет того, что в одном формате - это очень хорошо.

Я так поняла, что исходником для всего действа все-таки должен быть Ворд?



[quote name='Saizo' date='5 March 2005']Кстати, мне (как и многим другим наверное) объем текста в байтах гораздо привычнее и информативнее чем объем в страницах (который все равно мысленно транслируется в байты). [right][post="70981"]<{POST_SNAPBACK}>[/post][/right][/quote]

Сайзо, тут мне кажется ты преувеличиваешь. Для большинства все-таки привычнее объем в страницах (как в обычной книге, 20 страничек - тоненькая книжечка, 200 - средняя, 800 - толстая :victory: ). Вот мне например объем фанфика 100кб мало о чем говорит.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 06 Mar 2005, 19:44

[quote]Наверно лучше тогда все переносить в конец главы.[/quote]

Ага. А читатель потом будет искать где этот конец главы внутри текста, проматывая вперёд и устраивая себе спойлеры.

Может, лучше пихнуть все сноски в отдельный файл, который можно открыть в собственном окне?.. Я, как читатель, предпочёл бы именно такой вариант.



[quote]Вот мне например объем фанфика 100кб мало о чем говорит.[/quote]

Мне, кстати, привычнее в килобайтах. Но страницыа - это, всё-таки, стандартная единица измерения.
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 06 Mar 2005, 20:07

[quote name='Cheb' date='6 March 2005']Может, лучше пихнуть все сноски в отдельный файл, который можно открыть в собственном окне?.. Я, как читатель, предпочёл бы именно такой вариант.

[right][post="71031"]<{POST_SNAPBACK}>[/post][/right][/quote]

Я не против.

[quote name='Cheb' date='6 March 2005']Мне, кстати, привычнее в килобайтах. Но страницыа - это, всё-таки, стандартная единица измерения.

[right][post="71031"]<{POST_SNAPBACK}>[/post][/right][/quote]

Програмеррррыыы... *^_^*

Я все-таки однозначно за страницы. Страницы все понимают. :victory:
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 06 Mar 2005, 20:57

[quote]Насчет того, что в одном формате - это очень хорошо.

Я так поняла, что исходником для всего действа все-таки должен быть Ворд?[/quote]Если тебе удасться уговорить переводчиков сразу слать тебе человеческие TXTшки, то дело сведется только к HTML-верстке (что при едином формате легко автоматизировать). Пока же как я понял тебе впаривают DOC'и. Ну а в вынужденной нелегкой борьбе с подобным проявлением вселенского зла и превращением его во что-то съедобное тебе могут помочь предложенные макросы....



Лучше же всего поискать в сети какой-нибудь удобный и небольшой текстовый тедатор и порекомендовать его переводчикам (Ауу! Люди! Какие будут соображения на предмет что рекомендовать?). И определить несложные правила оформления. Например, такие: Длина строки произвольна, абзацы отделяются друг от друга пустой строкой, разделы - двумя и более строками (при HTML верстке заменятся звездочками). Каждая глава вынесена в отдельный файл, причем первая строка (или абзац?) - ее название. Сноски оформлены цифрами в квадратных скобках. Сам текст сноски оформляется в виде абзаца, начинающегося с номера сноски в квадратных скобках (или нескольких абзацев, но тогда весь текст должен быть заулючен в квадратные скобки (текст сноски может располагаться где угодно в тексте главы). Пример:



---------------------------------------

......

душолдывао вы[b][1][/b] alskjdkalsjd as,j kej xm, e,

asl askkjals



asldjk mas

......

ewr,jkf ejkfr [b][2][/b] уьцорловти

......



[b][1][/b] kej jerwk dsf dfse



..........

ew eweelkrjwlk vlkejlkrjlwejlw

wrlwkjrelkwjrlwrw

..........



[b][2] [[/b],kkasjh asa



asjlkjas lakslda

asdkajlksdjlaks;;as

kjhkj k jkjkkj

[b]][/b]

---------------------------------------



[quote]Сайзо, тут мне кажется ты преувеличиваешь. Для большинства все-таки привычнее объем в страницах (как в обычной книге, 20 страничек - тоненькая книжечка, 200 - средняя, 800 - толстая). Вот мне например объем фанфика 100кб мало о чем говорит.[/quote] Гм. Я от бумажных книг отвык уже черт его знает сколько лет назад.... А 100кб это понятно - средний рзмер для oneshot'а... :victory:
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 06 Mar 2005, 21:07

[quote]Может, лучше пихнуть все сноски в отдельный файл, который можно открыть в собственном окне?.. Я, как читатель, предпочёл бы именно такой вариант.[/quote]Если сноски будут раскрыты в конце главы (читай - в конце файла), то найти ее проблем не составит (ctrl+end). А вот отдельный файл сносок только нарушит простой и наглядный принцип "одна глава - один файл"...



[quote]Я все-таки однозначно за страницы. Страницы все понимают.[/quote]Можно и страницы тоже указывать - вреда никакого. Но главное - не забыть указать объем несжатого текста в байтах... ^_^
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 06 Mar 2005, 21:26

[quote name='Saizo' date='6 March 2005']Но главное - не забыть указать объем несжатого текста в байтах... ^_^

[right][post="71041"]<{POST_SNAPBACK}>[/post][/right][/quote]

С несжатым сложнее. Сейчас я в архиве использую такую бяку

[code]<!--#fsize virtual="/arh/ten.zip"-->[/code]

соответственно, если я что-то меняю в этом архиве - мне не надо пересчитывать размер.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 06 Mar 2005, 21:27

[quote]то найти ее проблем не составит (ctrl+end).[/quote]

А обратно к тому месту, где читал, как?.. в Листере кнопки "назад" нету, в отличие от браузера.



[quote]А вот отдельный файл сносок только нарушит простой и наглядный принцип "одна глава - один файл"...[/quote]

Ууу... Я имел это в виду для случая, когда все главы - в одном файле.



[quote]Пока же как я понял тебе впаривают DOC'и.[/quote]

А вот бочку не надо катить, уважаемый! Я ей готовый html отсылаю.
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 06 Mar 2005, 22:45

[quote name='Cheb' date='6 March 2005']Я ей готовый html отсылаю.

[right][post="71044"]<{POST_SNAPBACK}>[/post][/right][/quote]

Да. Он и Тролль присылают мне готовые странички.

hitori sabi и Maxv - доки (что мне в общем тоже удобно. Очень помогает программа Чеба, которая ставит абзацы).

Но вот текстовые версии...



Кстати, сразу хочу сказать: мне самой удобнее в Ворде переводить *^_^* :victory:
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 07 Mar 2005, 14:17

[quote]С несжатым сложнее. Сейчас я в архиве использую такую бяку[/quote]Но ведь если что-то меняется в архиве, то и размер в страницах тоже изменится, а эта команда его не определяет... Впрочем, размер зипа тоже весьма информативен.



[quote]А обратно к тому месту, где читал, как?.. в Листере кнопки "назад" нету, в отличие от браузера.[/quote]Я обычно для просмотра сноски просто открываю этот же файл в другом окне...



[quote]А вот бочку не надо катить, уважаемый! Я ей готовый html отсылаю.[/quote]Насчет бочки и в мыслях не было. Просто по предыдущим постам возникло впечатление что Лана получает пополам DOCи и HTML.



[quote]Кстати, сразу хочу сказать: мне самой удобнее в Ворде переводить[/quote]<grrr... Bill!!! Prepare to die you foul sorcerer!>... Окей, раз удобнее, значит удобнее. Однако, разговор в обще-то начинался с другого: в каком формате выкладывать архивы. Имхо, идеальный формат фанфика это чистый текст разбитый на файлы по главам и со сносками в конце главы. HTML тоже ничего, но все-таки это лишнее - в нем неизбежно будут наблюдаться оформительские приемы владельца сайта, откуда этот фик скачан. И поскольку сайтов много, вся эта эклектика в оформлении будет сильно раздражать. Если бы Lister при отображении HTML не плевал с высокой колокольни на все эти дизайнерские изыски, то все хтмлы потвергались бы такой же немедленной конвертации в TXT, какой сечас подвергаются всякие ртфы и доки... В общем, как я уже говорил: фанфик это текст. Только текст. И пихать в архив что-то еще это все равно что торгуя автомобилями в разных странах неизменно навязывать в нагрузку к мерседесу роскошный гараж в Зимбабве...



Ну а если в итоге нас интересует только получившийся текст, то мне кажется нерациональным представлять его на промежуточных этапах обработки как нечто большее... Кстати, Лана, из чистого любопытства - какие еще текстовые редакторы кроме ворда ты пробовала использовать при переводе?



[quote]Но вот текстовые версии...[/quote]Ммм... какие именно аспекты работы с TXT тебя смущают?
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 08 Mar 2005, 09:49

[quote name='Saizo' date='7 March 2005']Но ведь если что-то меняется в архиве, то и размер в страницах тоже изменится, а эта команда его не определяет... Впрочем, размер зипа тоже весьма информативен.

[right][post="71072"]<{POST_SNAPBACK}>[/post][/right][/quote]

Там еще дата рядом стоит :victory: И размер меняется (обычно добавляется новая глава).
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 08 Mar 2005, 09:58

[quote name='Saizo' date='7 March 2005']HTML тоже ничего, но все-таки это лишнее - в нем неизбежно будут наблюдаться оформительские приемы владельца сайта, откуда этот фик скачан. И поскольку сайтов много, вся эта эклектика в оформлении будет сильно раздражать.

[right][post="71072"]<{POST_SNAPBACK}>[/post][/right][/quote]

С этим я согласна.



[quote name='Saizo' date='7 March 2005']Кстати, Лана, из чистого любопытства - какие еще текстовые редакторы кроме ворда ты пробовала использовать при переводе?

[right][post="71072"]<{POST_SNAPBACK}>[/post][/right][/quote]

Знаешь, в общем-то никакие. Простенькие неудобны тем, что не подсказывают ошибки. А еще ворд стоит почти на всех компах (как я говорила уже - я не встречала компьютера на котором не установлен ворд) - одно время я переводила и дома и на работе.



[quote name='Saizo' date='7 March 2005'][quote name='Lana' date='6 March 2005']

Но вот текстовые версии...

[right][post="71047"]<{POST_SNAPBACK}>[/post][/right][/quote]



Ммм... какие именно аспекты работы с TXT тебя смущают?

[right][post="71072"]<{POST_SNAPBACK}>[/post][/right]

[/quote]

Я этим хотела сказать, что с текстовыми версиями сейчас все запущено - мне надо вручную это обрабатывать. Доки я обрабатываю прогой Чеба :victory: (она ставит абзацы). И у меня не очень много времени уходит на обработку.





[i]Может чтобы нам сдвинуться окончательно в сторону конкретного решения проблемы, мне стоит выложить маленький кусочек текста, в котором присутствуют все элементы?

Остальные переводчики внесут свои предложения (что они используют в ворде) и мы конкретно посмотрим, что можно сделать?[/i]
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 08 Mar 2005, 11:26

[quote]Доки я обрабатываю прогой Чеба [Влюблен по уши]  (она ставит абзацы).[/quote]

Я, кстати, ей уже не пользуюсь. Dreamweaver MX 2004 - программа хоть и тормозная, и с заскоками, но текст из Ворда позволяет вставлять методом Copy-Paste, выдавая на выходе нормальный html. C абзацами. Сохраняя все выделения курсивом и жирным шрифтом.



[quote]Остальные переводчики внесут свои предложения (что они используют в ворде)[/quote]

1. Автоматическая проверка орфографии на лету, подчёркивает слова с ошибками - сразу видно.

2. Возможность выделять слова жирным шрифтом и курсивом.

3. Наличие кнопки "раскрашивания" выделенного текста, и возможности удалить текст заданного цвета разом во всём документе (очень удобно для перевода, позволяет проверять и отлаживать текст в виде билингвы).

4. Автоматическое сохранение каждые n минут - на случай, если компьютер повиснет.

Всё. Остальные фичи Ворда мне глубоко до лампочки.
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 08 Mar 2005, 15:29

[quote name='Cheb' date='8 March 2005']Dreamweaver MX 2004

[right][post="71129"]<{POST_SNAPBACK}>[/post][/right][/quote]

Я не люблю визивижные редакторы :victory:

А так по пунктам 1-4 согласна с Чебом. Я это тоже все использую.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

PreviousNext

Return to Thematic talk

Who is online

Users browsing this forum: Google [Bot] and 18 guests