Mar. 20th, 2004
DSL и открытый словарный формат
Mar. 20th, 2004 07:13 amКаждый словарь и каждый тип словарей характеризуется определенным набором т.н. лексикографических параметров, то есть видов информации, которая в нем сообщается о входящих в него словарных единицах. Например, для переводного двуязычного словаря это могут быть: а) для левой части -- 1) ударение, 2) часть речи, 3) род/переходность/и т.д... б) для правой части -- 1) ударение, 2) указание на сферу применения (бот., комп. и т.д.), 3) указание на сочетаемость, 4) указание на фразеологичность, 5) указание на экспрессивность... Штука в том, что для каждого словаря -- и уж подавно для каждого типа словарей -- набор этих параметров разный. А всего лексикографические параметры исчисляются сотнями. То есть никакой жесткий стандарт для разметки DSL-подобного сырца не может быть исчерпывающим и никогда не будет.
Это говорит о том, что набор тэгов для разметки должен быть расширяемым. Возможно, на основе XML. Возможно, на основе новейшего, еще более обобщенного RDF (о котором я, правда, почти ничего не знаю; но рекомендации w3c по нему уже есть). А также о том, что DSL-формат Лингвы, при всем своем удобстве для определенного круга задач, универсальным назван быть не может. И не будет универсальным, пока не станет открытым -- и в смысле свободно распространяемым, и в смысле расширяемым.
Надо бы почитать, что об этом думают в TEI (Text Encoding Initiative) и в компании Micra (которая разметила Вебстера начала века).
Это говорит о том, что набор тэгов для разметки должен быть расширяемым. Возможно, на основе XML. Возможно, на основе новейшего, еще более обобщенного RDF (о котором я, правда, почти ничего не знаю; но рекомендации w3c по нему уже есть). А также о том, что DSL-формат Лингвы, при всем своем удобстве для определенного круга задач, универсальным назван быть не может. И не будет универсальным, пока не станет открытым -- и в смысле свободно распространяемым, и в смысле расширяемым.
Надо бы почитать, что об этом думают в TEI (Text Encoding Initiative) и в компании Micra (которая разметила Вебстера начала века).
Кніжкі апошняга часу
Mar. 20th, 2004 07:47 pm- Павел Сьцяцко. Культура мовы. Мн., Тэхналогія, 2002. Пад адной назвай і адной вокладкай -- дзьве яго ранейшыя кніжкі, што выдаваліся мізэрнымі накладамі ў Гародні.
- Мінск незнаёмы. 1920--1940. Мн., Ураджай, 2002. Фотаальбом, а ў дадатку -- "Спадарожнік па Менску" 1930 г., што яго цытаваў
rydel23. - Беларуская мова, інтэрнет і камп'ютэр. Матэрыялы "Круглага стала" міжнароднага сімпозіума "Разнастайнасць моў і культур у кантэксце глабалізацыі". Мінск, 20 мая 2002 г. Мн., Беларускі сацыяльна-экалагічны саюз "Чарнобыль", 2002. Кідаецца ў вочы адсутнасьць сярод удзельнікаў Шчэрбіна, гл. ягоны арт. у адным з апошніх №№ "Роднага слова" і ягоную кніжку пра беларускую лексыкаграфію, што ляжыць у файлавым разьдзеле на "Мовазнаўстве".
- Интернет. Желтые страницы. Белорусские ресурсы. 2004. Вельмі пазнавальна.
- Я.И.Гин. Проблемы поэтики грамматических категорий. СПб, 1996.
- Лоуренс Аравийский. Семь столпов мудрости. СПб, "Азбука", 2001.
- Т.Л.Брускина, Л.Ф.Шитова. Краткий русско-английский фразеологический словарь. СПб, 1998.
- Ian Fleming. Doctor No. СПб, 2003.
Чаму столькі піцерскіх кніжак? Дальбог, наўмысьля не падбіраў :)