Автоконверторы

Any discussions other than spam

Unread postby Saizo (архив) » 20 Jun 2005, 13:03

Народ, вот первый вартиант DOC2TXT конвертора. Наверняка в нем тьма багов, так что всем заинтересованным простьба принять участие в их отлове. ^_^



Как видно из названия, макрос конвертит DOC в TXT. Для дальнейшей конвертации полученых текстов в HTML, будет написана отдельная прога, т.к. VBA слишком тормозной и неудобный чтобы наитсать хороший HTML-конвертор. К тому же такой подход позволит конвертить фики сразу написанные в тексте и не проходившие DOC-стадию...



ЗЫ. Что еще нужно добавить?
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Xelloss (архив) » 20 Jun 2005, 13:08

ммм а почему низя уже написаными пользоваться?Или ты писал штуку что сразу будет конвертить в страничку с ланиным оформлением?
User avatar
Xelloss (архив)
 
Posts: 3
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 20 Jun 2005, 13:15

[quote]ммм а почему низя уже написаными пользоваться?Или ты писал штуку что сразу будет конвертить в страничку с ланиным оформлением?[/quote]

Нет. Это будет делать внешняя прога. А макрос нужен чтобы при промежуточном переводе в текст не терятись элементы оформления. К тому же встроенный конвертор мало того что глюкавый, так еще и кривой. После него требуется много ручной доводки даже при подготовке обычного TXT для выкладывания в текстовом виде.
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Xelloss (архив) » 20 Jun 2005, 13:19

Я как конвектор имелл виду ворд...хотя вам виднее...
User avatar
Xelloss (архив)
 
Posts: 3
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 20 Jun 2005, 13:30

[quote]Я как конвектор имелл виду ворд...[/quote]Когда я говорил "кривой" и "глюкавый" я тоже имел ввиду именно ворд... ^_^
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 20 Jun 2005, 13:49

Ну, не знаю... я у себя давно уже всё мелкософтовское снёс - кроме самой Выни, и Иё, который прибит намертво.



Так что Ворд (а равно скрипты к нему) для меня теперь - иностранная диковинка.



OOo великолепно конвертирует документы в html, остаётся лишь слегка подчистить ("найти и заменить") от залетевших элементов оформления вроде "язык абзаца- английский". Плюс, он ещё весь внедрённый японский текст правильно переводит в формат &#<код символа>; Да ещё и спеллчекер с учётом буквы "ё" работает!.. И зачем после этого Ворд?..
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 20 Jun 2005, 14:33

По поводу "на фига это нужно", "на фига вообще нужен ворд..." давайте не будем, ок? Когда встал вопрос привести в порядок архив только Сэн вызвалась поработать ручками. Галдеть то все горазды.





Сайзо, попробовала запустить вылезло вот что:

[code]Run-time error: 76

Path not found[/code]



Тут я подумала и в поле, понимание которого ни для кого недоступно, заменила \ на /

О, что-то получилось!



Кстати во второй раз менять уже не надо.

[i]Ворд завис... [/i] *^_^* :)

А нет, отвис :victory: Это он просто думал :)



В итоге получился файл. Текстовый.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 20 Jun 2005, 14:37

[quote name='Saizo' date='20 Jun 2005, 14:15']А макрос нужен чтобы при промежуточном переводе в текст не терятись элементы оформления.

[right][post="81143"]<{POST_SNAPBACK}>[/post][/right][/quote]

Я вот это не поняла. Ведь в итоге нужна чистенькая такая текстовая версия, без излишеств (только отмеченными, например звездочками, заголовками, ну и может как-то подработанными сносками и инфе об авторах), а сейчас там получается что-то типа {i}курсив{/i}.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby chebmaster » 20 Jun 2005, 15:17

[quote]Я вот это не поняла.[/quote]

Дык чего ж непонятного?.. Я так понимаю, планируется

DOC -> HTML для сайта ->TXT.

А поскольку Ворд конвертирует DOC -> HTML так, что на код потом смотреть страшно, нередко применяют схему (я и сам когда-то такой пользовался)

DOC -> TXT -> HTML для сайта

, в которой курсив идёт лесом... Помнишь, я даже программу специальную тебе писал?..
User avatar
chebmaster
Site Admin
 
Posts: 915
Joined: 06 Apr 2013, 13:38

Unread postby Лана (архив) » 20 Jun 2005, 15:23

[quote name='Cheb' date='20 Jun 2005, 16:17']Помнишь, я даже программу специальную тебе писал?..

[right][post="81153"]<{POST_SNAPBACK}>[/post][/right][/quote]

Помню :victory: Я и сейчас ей пользуюсь *^_^*
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 20 Jun 2005, 15:30

[quote]Я вот это не поняла. Ведь в итоге нужна чистенькая такая текстовая версия, без излишеств (только отмеченными, например звездочками, заголовками, ну и может как-то подработанными сносками и инфе об авторах), а сейчас там получается что-то типа {i}курсив{/i}.[/quote]Сноски будут в следующей версии. Насчет инфы по авторам не понял - как она выделена в доке, и чего с ней надо сделать в тексте.



Именно чистеньная текстовая версия и получается, если не включать EFS (просто не ставить галочку в соответствующем чекбоксе). А поддержка этого самого EFS нужна для получения этакого полуфабриката, который в дальнейшем автоматической будем конвертить в HTML (если мы хотим сохранить при этом соответствующие элементы оригинального оформления, т.к. чистый текст никаких болдов и италиков не различает)



[quote]Run-time error: 76

Path not found[/quote]Если не хочешь каждый раз вводить имя файла заново, можешь прописать нужное имя прямо в макросе, это строка в самом его начале: [code]Private Const DefaultFilename = "C:\Anime\_work\test001.txt"[/code]



[quote]Ворд завис...[/quote]Т.е. во время работы он не показывал текущий прогресс в %? Странно. Очень странно... А какой у тебя ворд, и что за машина?
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 20 Jun 2005, 15:44

[quote name='Saizo' date='20 Jun 2005, 16:30']Именно чистеньная текстовая версия и получается, если не включать EFS

[right][post="81156"]<{POST_SNAPBACK}>[/post][/right][/quote]

Понятно.

А заголовки как-нибудь будут выделяться?

С авторами наверно можно не париться, в принципе. Ну или можно что-то типа:



---------------------------------

Автор: ххх

Е-mail: yyy

Web-страница: zzz



(Т.е. чертой отделять просто).



На то, что Ворд у меня завис - забей. Это мой комп. У него всегда так, когда какое-то приложение впадает в сильную задумчивость, впечатление такое, что оно зависло.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 20 Jun 2005, 20:24

Новая версия - 1.2b. Теперь, как и обещал, можно обрабатывать сноски. :laugh:



[quote]А заголовки как-нибудь будут выделяться?[/quote]Что именно считать заголовками (по стилю "заголовок1" или еще как?) и как именно их выделять?



[quote]С авторами наверно можно не париться, в принципе. Ну или можно что-то типа:



---------------------------------

Автор: ххх

Е-mail: yyy

Web-страница: zzz



(Т.е. чертой отделять просто).[/quote]А как мне инфу по авторам в исходном тексте найти? она чем-то выделена? или в свойствах дока зашита?



И еще вопрос - по поводу автоматического разбиения на главы. Я хочу разбивать по встречающимся параграфам со стилем "заголовок1". Сноски - в конце каждой главы. Если не разбивать - в конце файла, как сейчас. Такое разбиение вообще нужно? Или у тебя и так каждая глава в своем доке?
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 21 Jun 2005, 10:29

[quote name='Saizo' date='20 Jun 2005, 21:24']Что именно считать заголовками (по стилю "заголовок1" или еще как?) и как именно их выделять?

[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]

Да. Давай ограничимся двумя Заголовок 1 и Заголовок 2 (ну можно на всякий случай и 3, но необязательно).

Выделять можно как например так:



************* ЗАГОЛОВОК 1 ************



************* Заголовок 2 ************



[quote name='Saizo' date='20 Jun 2005, 21:24']А как мне инфу по авторам в исходном тексте найти? она чем-то выделена? или в свойствах дока зашита?

[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]

Это будет особый стиль. Например "автор".



[quote name='Saizo' date='20 Jun 2005, 21:24']И еще вопрос - по поводу автоматического разбиения на главы. Я хочу разбивать по встречающимся параграфам со стилем "заголовок1". Сноски - в конце каждой главы. Если не разбивать - в конце файла, как сейчас. Такое разбиение вообще нужно? Или у тебя и так каждая глава в своем доке?

[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]

Думаю нужно. Мне удобнее хранить все в одном файле, чем каждую главу в отдельном. Разбивать скорее тогда по "заголовок 2" (т.к. 1-ый используется для названия фанфика, а 2-ой для названия глав).
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 21 Jun 2005, 11:02

Бага кажется...



--------------------

Заголовок 1



Заголовок 2



По тем или иным причинам, код счётчиков[color="red"](1)[/color] систем интернет-статистики зачастую

приходится скрывать на странице. Оставим в стороне правомерность этого действия

(читайте(2) внимательно правила конкретного счётчика) и рассмотрим способы

сокрытия.







[color="red"](2)[/color] Сноска. Многое поясняет.



(2) Еще одна.

-----------------------



Если поставить третью сноску, то будет:

(3)

(3)

(3)
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 21 Jun 2005, 13:05

И еще я подумала, что может лучше сделать так:

---------------

По тем или иным причинам, код счётчиков[color="red"](сноска 1)[/color]



(Чтобы было однозначно понятно).
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 21 Jun 2005, 13:39

[quote]Если поставить третью сноску, то будет:

(3)

(3)

(3)[/quote]Эта, и многие другие баги уже исправлены в версии 1.3 :laugh:



[quote]И еще я подумала, что может лучше сделать так:

---------------

По тем или иным причинам, код счётчиков(сноска 1)[/quote]Для этого тебе достаточно поменять текст в[code]Private Const SMRN1 = "("[/code]на "(сноска " или любой другой, какой тебе понравится.



Насчет заголовков - сделаю в след. версиях.



Кстати, насчет тестирования - попробуй макрос на реально присланных переводах/фиках (с подстрочным переводом (и, значит, необходимостью фильтрации) и проч.). Нужно проверить его в боевых условиях, и посмотреть много ли ручной работы останется сделать после него (что бы потом ее тоже по возможности автоматизировать).
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Лана (архив) » 21 Jun 2005, 14:28

[quote name='Saizo' date='21 Jun 2005, 14:39']Кстати, насчет тестирования - попробуй макрос на реально присланных переводах/фиках (с подстрочным переводом (и, значит, необходимостью фильтрации) и проч.). Нужно проверить его в боевых условиях, и посмотреть много ли ручной работы останется сделать после него (что бы потом ее тоже по возможности автоматизировать).

[right][post="81269"]<{POST_SNAPBACK}>[/post][/right][/quote]

Я дома смогу это сделать. Постараюсь побыстрее, но не знаю как получится. В выходные эти я работаю :laugh: :) так что с моей стороны могут быть задержки в качественном тестировании. :)



Вспомнила, что еще бывает попадаются такие вещи в тексте, как письма или объявления. Может их вот так сделать:

======================

Дорогой Сайзо!

К тебе пишу... чего не знаю.... что мне еще здесь написать...

======================

В доке будут выделены особым стилем.
User avatar
Лана (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 21 Jun 2005, 16:02

[quote]Дорогой Сайзо!

К тебе пишу... чего не знаю.... что мне еще здесь написать...[/quote]Гы. Милая Лана! Если бы Татьяна прочла эти строки, с нее запросто можно было бы писать пейзажи. Во всяком случае дубовые рощи ее зелени завидывали б черной завистью (а Пушкин просто тихо удавился бы в уголке). :laugh:



[quote]Вспомнила, что еще бывает попадаются такие вещи в тексте, как письма или объявления. Может их вот так сделать: ...[/quote] в TXT можно сделать все что угодно. Вопрос тут такой же, как и в предыдущех случаях - как эти письма и объябления выцепить в доке?



[quote]В доке будут выделены особым стилем.[/quote]Смотри что получается: для авторов - свой особый стиль, для писем и объяв - другой. И запросто может появиться еще 3й, 4й и тд.... может просто инфу о стилях кидать в TXT EFS-тегами, а обрабатывать потом это безобразие уже внешней прогой? На VBA все это украшательство и писать неудобно, и тормозить будет изрядно....
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Unread postby Saizo (архив) » 21 Jun 2005, 16:15

[quote]может просто инфу о стилях кидать в TXT EFS-тегами, а обрабатывать потом это безобразие уже внешней прогой?[/quote]Невеселая мысль: если все эти письма-объявы-авторы жизнено важны и для обычных текстовых версий, то как бы не пришлось использовать схему DOC->TXT(EFS-полуфабрикат)->TXT.... С использованием внешней проги не только для создания хтмлов, но и простых текстов для архива...
User avatar
Saizo (архив)
 
Posts: 0
Joined: 07 Apr 2013, 00:06

Next

Return to Thematic talk

Who is online

Users browsing this forum: Google [Bot] and 22 guests