Bug 8173

Summary: неправильные пробелы в LaTeX-выводе
Product: Sisyphus Reporter: kirill <kirill>
Component: ALDConvertAssignee: Nobody's working on this, feel free to take it <nobody>
Status: ASSIGNED --- QA Contact: qa-sisyphus
Severity: normal    
Priority: P2 CC: mike
Version: unstable   
Hardware: all   
OS: Linux   

Description kirill 2005-10-10 11:02:07 MSD
Периодически в тексте наблюдаются неправильно подставленные/удалённые
конвертером пробелы. 

Примеры следуют:

Исходный текст					Вывод latex-writer'a
--------------					--------------------
``Dell 1024x768 Laptop Display Panel''		1024 x768
@freesource.info|http://freesource.info@ 	freesource. info
@linuxsupport.ru|http://linuxsupport. ru@ 	linuxsupport. ru
номер от 0 до n-1.				n -1
приводы (CD- и DVD-RW)				CD-и
Comment 1 kirill 2005-11-28 14:15:42 MSK
Ещё примеры с цифрами:

Исходный текст      Вывод latex-writer'a
--------------      --------------------
ядро Linux 2.6.11   2.6 .11
6.8.2               6.8 .2
Comment 2 Fr. Br. George 2005-12-16 04:18:53 MSK
исправлено в -alt8: теперь в числах может быть сколько угодно точек, внутри
слова бывают не только буквы, есть висячий знак препинаания "-", а конструкция
"n-1" считается Бойлем-Мариоттом
Comment 3 kirill 2006-03-06 19:00:56 MSK
разъём(ы)
даёт пробел: 
разъём (ы)

Вообще закрывать это явно преждевременно. 
Comment 4 Fr. Br. George 2006-03-09 15:09:46 MSK
> разъём(ы)
> даёт пробел: 
> разъём (ы)
То есть скобка -- это не знак препинания, а буква? Можно и так.
Comment 5 kirill 2006-03-09 17:27:23 MSK
> > даёт пробел: 
> > разъём (ы)
> То есть скобка -- это не знак препинания, а буква? Можно и так.

Смотря что ты понимаешь под буквой/препинанием. 
Бывает ещё вот так: (например?!) 
И интересный вопрос, что будет со смайликом, если его угораздит встретиться в
тексте.
Comment 6 Fr. Br. George 2006-03-09 18:00:38 MSK
> > То есть скобка -- это не знак препинания, а буква? Можно и так.
> Смотря что ты понимаешь под буквой/препинанием.
"Буква" -- это то, из чего состоит слово. "Знак препинания" -- разделитель,
возможно, выделяемый пробелами. Похоже, ты за то, чтобы вообще не было "знаков
препинания"? Если уж разделитель, то разделитель? Это бы сильно упростило
mk_read, да, только тогда его переделывать немножко надо.

Знаки препинания были задуманы для борьбы с системными опечатками (например,
многие любят пробел перед запятой ставить). Видимо, это я зря, и стоит их вообще
изъять? Это важный вопрос.

Некоторые знаки всё равно надо оставить самостоятельными единицами: "...", "-",
"--". Что ещё?

> Бывает ещё вот так: (например?!) 
> И интересный вопрос, что будет со смайликом, если его угораздит встретиться в
> тексте.
Попилится, если не будет взято в ^^.
Comment 7 kirill 2006-03-09 19:03:33 MSK
> Знаки препинания были задуманы для борьбы с системными опечатками (например,
> многие любят пробел перед запятой ставить). Видимо, это я зря, и стоит их вообще
> изъять? Это важный вопрос.

Если борьба с опечатками -- единственное, для чего заведены знаки препинания --
то я однозначно за то, чтобы их изъять. 

Такого рода искусственно-интеллектуальные улучшения текста скорее должны
выполняться специальной утилитой -- той самой, которая также знает, где
следует ставить неразрывные пробелы, чем отбиваются инициалы от фамилии, 
отделять ли пробелами тире между Бойлем и Мариоттом и т. п. 
Это такой особый этап работы с текстом, его полиграфическое причёсывание, 
причём оно никогда не бывает полностью автоматическим -- слишком уж много 
разнообразных случаев. Мне знакомы пара велосипедов такого типа. 
На мой взгляд, эта задача ортогональна конвертации из одной разметки в другую.

> Некоторые знаки всё равно надо оставить самостоятельными единицами: "...", "-",
> "--". Что ещё?

Ну да, это те, которые на самом деле нуль-местные теги.
А дефис зачем к ним относится? 
Comment 8 Fr. Br. George 2006-03-09 19:44:42 MSK
(In reply to comment #7)

> Если борьба с опечатками -- единственное, для чего заведены знаки препинания
> то я однозначно за то, чтобы их изъять.
Не только. Ещё для того. чтобы output-преобразователи не слишком много
занимались postprocessing-ом. То есть для выделения символов, которые по
определению вполне могут быть не-буквами.

Однако, если подумать, это -- тоже ортогональная задача. Мало ли, какие символы
не являются буквами в текущем выходном формате? А формат хранения это снова
упростит.

Однако вот, например, кавычки. Насколько проще -- или сложнее -- работать с
тегом "закавыченный текст" вместо "левая кавычка, слово, слово, ..., правая
кавычка"? Особенно в рассуждении ёлочек и лапок? У меня сейчас закавыченный
текст -- это тег.

> > Некоторые знаки всё равно надо оставить самостоятельными единицами: "...",
"-", "--". Что ещё?
> Ну да, это те, которые на самом деле нуль-местные теги.
Так что, других нет?

> А дефис зачем к ним относится? 
А он не является нульместным тегом? Тогда незачем.

Comment 9 kirill 2006-03-09 19:58:14 MSK
> Не только. Ещё для того. чтобы output-преобразователи не слишком много
> занимались postprocessing-ом. То есть для выделения символов, которые по
> определению вполне могут быть не-буквами.
> 
> Однако, если подумать, это -- тоже ортогональная задача. Мало ли, какие символы
> не являются буквами в текущем выходном формате? А формат хранения это снова
> упростит.
Безусловно ортогональная. Список символов, которые нужно экранировать,
специфичен для каждого формата, и там может оказаться что угодно. 
Предусматривать их все в общем формате хранения, видимо, не следует.

> Однако вот, например, кавычки. Насколько проще -- или сложнее -- работать с
> тегом "закавыченный текст" вместо "левая кавычка, слово, слово, ..., правая
> кавычка"? Особенно в рассуждении ёлочек и лапок? У меня сейчас закавыченный
> текст -- это тег.

Так а что мешает ему оставаться с тегом? 
Нормальный одноместный тег: открывающая последовательность, текст, закрывающая
последовательность. Чем отличается ``текст'' от <текст>?

> > > Некоторые знаки всё равно надо оставить самостоятельными единицами: "...",
> "-", "--". Что ещё?
> > Ну да, это те, которые на самом деле нуль-местные теги.
> Так что, других нет?

Абзац ещё -- \n\n. А больше я не могу припомнить.

> > А дефис зачем к ним относится? 
> А он не является нульместным тегом? Тогда незачем.

Похоже, незачем.

Comment 10 Fr. Br. George 2006-05-13 23:52:39 MSD
Кирилл, проверь. в каком состоянии эта бага. Может, её закрыть?
Comment 11 kirill 2008-04-02 15:04:34 MSD
(In reply to comment #10)
> Кирилл, проверь. в каком состоянии эта бага. Может, её закрыть?

man(8) -> man (8)

С точками и дефисами ведет себя корректно.