Page 1 of 2
Posted:
20 Jun 2005, 13:03
by Saizo (архив)
Народ, вот первый вартиант DOC2TXT конвертора. Наверняка в нем тьма багов, так что всем заинтересованным простьба принять участие в их отлове. ^_^
Как видно из названия, макрос конвертит DOC в TXT. Для дальнейшей конвертации полученых текстов в HTML, будет написана отдельная прога, т.к. VBA слишком тормозной и неудобный чтобы наитсать хороший HTML-конвертор. К тому же такой подход позволит конвертить фики сразу написанные в тексте и не проходившие DOC-стадию...
ЗЫ. Что еще нужно добавить?
Posted:
20 Jun 2005, 13:08
by Xelloss (архив)
ммм а почему низя уже написаными пользоваться?Или ты писал штуку что сразу будет конвертить в страничку с ланиным оформлением?
Posted:
20 Jun 2005, 13:15
by Saizo (архив)
[quote]ммм а почему низя уже написаными пользоваться?Или ты писал штуку что сразу будет конвертить в страничку с ланиным оформлением?[/quote]
Нет. Это будет делать внешняя прога. А макрос нужен чтобы при промежуточном переводе в текст не терятись элементы оформления. К тому же встроенный конвертор мало того что глюкавый, так еще и кривой. После него требуется много ручной доводки даже при подготовке обычного TXT для выкладывания в текстовом виде.
Posted:
20 Jun 2005, 13:19
by Xelloss (архив)
Я как конвектор имелл виду ворд...хотя вам виднее...
Posted:
20 Jun 2005, 13:30
by Saizo (архив)
[quote]Я как конвектор имелл виду ворд...[/quote]Когда я говорил "кривой" и "глюкавый" я тоже имел ввиду именно ворд... ^_^
Posted:
20 Jun 2005, 13:49
by chebmaster
Ну, не знаю... я у себя давно уже всё мелкософтовское снёс - кроме самой Выни, и Иё, который прибит намертво.
Так что Ворд (а равно скрипты к нему) для меня теперь - иностранная диковинка.
OOo великолепно конвертирует документы в html, остаётся лишь слегка подчистить ("найти и заменить") от залетевших элементов оформления вроде "язык абзаца- английский". Плюс, он ещё весь внедрённый японский текст правильно переводит в формат &#<код символа>; Да ещё и спеллчекер с учётом буквы "ё" работает!.. И зачем после этого Ворд?..
Posted:
20 Jun 2005, 14:33
by Лана (архив)
По поводу "на фига это нужно", "на фига вообще нужен ворд..." давайте не будем, ок? Когда встал вопрос привести в порядок архив только Сэн вызвалась поработать ручками. Галдеть то все горазды.
Сайзо, попробовала запустить вылезло вот что:
[code]Run-time error: 76
Path not found[/code]
Тут я подумала и в поле, понимание которого ни для кого недоступно, заменила \ на /
О, что-то получилось!
Кстати во второй раз менять уже не надо.
[i]Ворд завис... [/i]
А нет, отвис
Это он просто думал
В итоге получился файл. Текстовый.
Posted:
20 Jun 2005, 14:37
by Лана (архив)
[quote name='Saizo' date='20 Jun 2005, 14:15']А макрос нужен чтобы при промежуточном переводе в текст не терятись элементы оформления.
[right][post="81143"]<{POST_SNAPBACK}>[/post][/right][/quote]
Я вот это не поняла. Ведь в итоге нужна чистенькая такая текстовая версия, без излишеств (только отмеченными, например звездочками, заголовками, ну и может как-то подработанными сносками и инфе об авторах), а сейчас там получается что-то типа {i}курсив{/i}.
Posted:
20 Jun 2005, 15:17
by chebmaster
[quote]Я вот это не поняла.[/quote]
Дык чего ж непонятного?.. Я так понимаю, планируется
DOC -> HTML для сайта ->TXT.
А поскольку Ворд конвертирует DOC -> HTML так, что на код потом смотреть страшно, нередко применяют схему (я и сам когда-то такой пользовался)
DOC -> TXT -> HTML для сайта
, в которой курсив идёт лесом... Помнишь, я даже программу специальную тебе писал?..
Posted:
20 Jun 2005, 15:23
by Лана (архив)
[quote name='Cheb' date='20 Jun 2005, 16:17']Помнишь, я даже программу специальную тебе писал?..
[right][post="81153"]<{POST_SNAPBACK}>[/post][/right][/quote]
Помню
Я и сейчас ей пользуюсь
Posted:
20 Jun 2005, 15:30
by Saizo (архив)
[quote]Я вот это не поняла. Ведь в итоге нужна чистенькая такая текстовая версия, без излишеств (только отмеченными, например звездочками, заголовками, ну и может как-то подработанными сносками и инфе об авторах), а сейчас там получается что-то типа {i}курсив{/i}.[/quote]Сноски будут в следующей версии. Насчет инфы по авторам не понял - как она выделена в доке, и чего с ней надо сделать в тексте.
Именно чистеньная текстовая версия и получается, если не включать EFS (просто не ставить галочку в соответствующем чекбоксе). А поддержка этого самого EFS нужна для получения этакого полуфабриката, который в дальнейшем автоматической будем конвертить в HTML (если мы хотим сохранить при этом соответствующие элементы оригинального оформления, т.к. чистый текст никаких болдов и италиков не различает)
[quote]Run-time error: 76
Path not found[/quote]Если не хочешь каждый раз вводить имя файла заново, можешь прописать нужное имя прямо в макросе, это строка в самом его начале: [code]Private Const DefaultFilename = "C:\Anime\_work\test001.txt"[/code]
[quote]Ворд завис...[/quote]Т.е. во время работы он не показывал текущий прогресс в %? Странно. Очень странно... А какой у тебя ворд, и что за машина?
Posted:
20 Jun 2005, 15:44
by Лана (архив)
[quote name='Saizo' date='20 Jun 2005, 16:30']Именно чистеньная текстовая версия и получается, если не включать EFS
[right][post="81156"]<{POST_SNAPBACK}>[/post][/right][/quote]
Понятно.
А заголовки как-нибудь будут выделяться?
С авторами наверно можно не париться, в принципе. Ну или можно что-то типа:
---------------------------------
Автор: ххх
Е-mail: yyy
Web-страница: zzz
(Т.е. чертой отделять просто).
На то, что Ворд у меня завис - забей. Это мой комп. У него всегда так, когда какое-то приложение впадает в сильную задумчивость, впечатление такое, что оно зависло.
Posted:
20 Jun 2005, 20:24
by Saizo (архив)
Новая версия - 1.2b. Теперь, как и обещал, можно обрабатывать сноски.
[quote]А заголовки как-нибудь будут выделяться?[/quote]Что именно считать заголовками (по стилю "заголовок1" или еще как?) и как именно их выделять?
[quote]С авторами наверно можно не париться, в принципе. Ну или можно что-то типа:
---------------------------------
Автор: ххх
Е-mail: yyy
Web-страница: zzz
(Т.е. чертой отделять просто).[/quote]А как мне инфу по авторам в исходном тексте найти? она чем-то выделена? или в свойствах дока зашита?
И еще вопрос - по поводу автоматического разбиения на главы. Я хочу разбивать по встречающимся параграфам со стилем "заголовок1". Сноски - в конце каждой главы. Если не разбивать - в конце файла, как сейчас. Такое разбиение вообще нужно? Или у тебя и так каждая глава в своем доке?
Posted:
21 Jun 2005, 10:29
by Лана (архив)
[quote name='Saizo' date='20 Jun 2005, 21:24']Что именно считать заголовками (по стилю "заголовок1" или еще как?) и как именно их выделять?
[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]
Да. Давай ограничимся двумя Заголовок 1 и Заголовок 2 (ну можно на всякий случай и 3, но необязательно).
Выделять можно как например так:
************* ЗАГОЛОВОК 1 ************
************* Заголовок 2 ************
[quote name='Saizo' date='20 Jun 2005, 21:24']А как мне инфу по авторам в исходном тексте найти? она чем-то выделена? или в свойствах дока зашита?
[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]
Это будет особый стиль. Например "автор".
[quote name='Saizo' date='20 Jun 2005, 21:24']И еще вопрос - по поводу автоматического разбиения на главы. Я хочу разбивать по встречающимся параграфам со стилем "заголовок1". Сноски - в конце каждой главы. Если не разбивать - в конце файла, как сейчас. Такое разбиение вообще нужно? Или у тебя и так каждая глава в своем доке?
[right][post="81192"]<{POST_SNAPBACK}>[/post][/right][/quote]
Думаю нужно. Мне удобнее хранить все в одном файле, чем каждую главу в отдельном. Разбивать скорее тогда по "заголовок 2" (т.к. 1-ый используется для названия фанфика, а 2-ой для названия глав).
Posted:
21 Jun 2005, 11:02
by Лана (архив)
Бага кажется...
--------------------
Заголовок 1
Заголовок 2
По тем или иным причинам, код счётчиков[color="red"](1)[/color] систем интернет-статистики зачастую
приходится скрывать на странице. Оставим в стороне правомерность этого действия
(читайте(2) внимательно правила конкретного счётчика) и рассмотрим способы
сокрытия.
[color="red"](2)[/color] Сноска. Многое поясняет.
(2) Еще одна.
-----------------------
Если поставить третью сноску, то будет:
(3)
(3)
(3)
Posted:
21 Jun 2005, 13:05
by Лана (архив)
И еще я подумала, что может лучше сделать так:
---------------
По тем или иным причинам, код счётчиков[color="red"](сноска 1)[/color]
(Чтобы было однозначно понятно).
Posted:
21 Jun 2005, 13:39
by Saizo (архив)
[quote]Если поставить третью сноску, то будет:
(3)
(3)
(3)[/quote]Эта, и многие другие баги уже исправлены в версии 1.3
[quote]И еще я подумала, что может лучше сделать так:
---------------
По тем или иным причинам, код счётчиков(сноска 1)[/quote]Для этого тебе достаточно поменять текст в[code]Private Const SMRN1 = "("[/code]на "(сноска " или любой другой, какой тебе понравится.
Насчет заголовков - сделаю в след. версиях.
Кстати, насчет тестирования - попробуй макрос на реально присланных переводах/фиках (с подстрочным переводом (и, значит, необходимостью фильтрации) и проч.). Нужно проверить его в боевых условиях, и посмотреть много ли ручной работы останется сделать после него (что бы потом ее тоже по возможности автоматизировать).
Posted:
21 Jun 2005, 14:28
by Лана (архив)
[quote name='Saizo' date='21 Jun 2005, 14:39']Кстати, насчет тестирования - попробуй макрос на реально присланных переводах/фиках (с подстрочным переводом (и, значит, необходимостью фильтрации) и проч.). Нужно проверить его в боевых условиях, и посмотреть много ли ручной работы останется сделать после него (что бы потом ее тоже по возможности автоматизировать).
[right][post="81269"]<{POST_SNAPBACK}>[/post][/right][/quote]
Я дома смогу это сделать. Постараюсь побыстрее, но не знаю как получится. В выходные эти я работаю
так что с моей стороны могут быть задержки в качественном тестировании.
Вспомнила, что еще бывает попадаются такие вещи в тексте, как письма или объявления. Может их вот так сделать:
======================
Дорогой Сайзо!
К тебе пишу... чего не знаю.... что мне еще здесь написать...
======================
В доке будут выделены особым стилем.
Posted:
21 Jun 2005, 16:02
by Saizo (архив)
[quote]Дорогой Сайзо!
К тебе пишу... чего не знаю.... что мне еще здесь написать...[/quote]Гы. Милая Лана! Если бы Татьяна прочла эти строки, с нее запросто можно было бы писать пейзажи. Во всяком случае дубовые рощи ее зелени завидывали б черной завистью (а Пушкин просто тихо удавился бы в уголке).
[quote]Вспомнила, что еще бывает попадаются такие вещи в тексте, как письма или объявления. Может их вот так сделать: ...[/quote] в TXT можно сделать все что угодно. Вопрос тут такой же, как и в предыдущех случаях - как эти письма и объябления выцепить в доке?
[quote]В доке будут выделены особым стилем.[/quote]Смотри что получается: для авторов - свой особый стиль, для писем и объяв - другой. И запросто может появиться еще 3й, 4й и тд.... может просто инфу о стилях кидать в TXT EFS-тегами, а обрабатывать потом это безобразие уже внешней прогой? На VBA все это украшательство и писать неудобно, и тормозить будет изрядно....
Posted:
21 Jun 2005, 16:15
by Saizo (архив)
[quote]может просто инфу о стилях кидать в TXT EFS-тегами, а обрабатывать потом это безобразие уже внешней прогой?[/quote]Невеселая мысль: если все эти письма-объявы-авторы жизнено важны и для обычных текстовых версий, то как бы не пришлось использовать схему DOC->TXT(EFS-полуфабрикат)->TXT.... С использованием внешней проги не только для создания хтмлов, но и простых текстов для архива...