XDXF

XML Dictionary eXchange Format
Расширение .xdxf
Разработчик Сергей Сингов, Леонид Сошинский, и др.
Опубликован 9.10.2006
Последний выпуск rev.32 (2013-10-06)
Тип формата словарные форматы
Открытый формат? Да
makedict
Тип converter[прояснить] словарей
Разработчики mrcoder1234, kubtek
Написана на C++
Дата выпуска 10 сентября 2006; 19 лет назад (2006-09-10)
Аппаратная платформа кросс-платформенный
Последняя версия 0.4 (16 лет 146 дней тому назад)
Тестовая версия 0.4.1-beta1 (2012 (2012))
Репозиторий github.com/soshial/xdxf_…
Лицензия GNU GPL
Сайт github.com/soshial/xdxf_…

XDXF (XML Dictionary eXchange Format) — свободный проект по объединению всех существующих словарных форматов на основе универсального XML-формата, поддерживающего возможность структурно-семантической разметки словарных статей. Проект включает в себя открытый формат XDXF и open-source конвертер словарей различных форматов. Формат позволяет создавать как обычные пользовательские словари, так и тезаурусы и онтологии. Проект находится в фазе активного развития[1][источник не указан 2228 дней].

Преимущества и недостатки

Основные преимущества перед конкурирующими форматами[источник не указан 2228 дней]:

  • обладает богатой схемой мета-информации о файле (издатель, автор, редактор, год издания и т. п.; позволяет сортировать файлы в библиотеке словарей)
  • позволяет ссылаться не только на полные словарные статьи, но и на их части
  • позволяет выделять в словарной статье основные варианты переводов для предпросмотра статей[2]
  • обладает гибкой настройкой полнотекстовой индексации словаря
  • богатая система семантически связанных слов (синонимы, гиперонимы, антонимы, меронимы и т. п.)
  • позволяет относиться словарные статьи к категориям, подобным категориям статей на Википедии

Особенности формата XDXF

Визуальный тип оформления был оставлен с целью сохранить совместимость со старыми версиями и со словарями, сконвертированными из других форматов, не поддерживающих структурно-семантическую разметку. Вид выводимых статей полностью отвечает форматирование, отступы, выделения текста, описанные внутри XML кода. Структурно-семантическое оформление же позволяет иметь вложенные словарные статьи; оформление статей этого вида полностью перелагается на плечи программной оболочки, которая должна позволять настраивать цвета и внешний вид словаря. Есть возможность дополнять их транскрипцией, синонимами, антонимами, гиперонимами, этимологией, фразеологизмами, грамматическую информацию, аббревиатуры, ссылки на другие статьи, внешние медиа-файлы, исключение из индекса, комментарии, примеры использования и другое. Благодаря перечисленному формат XDXF обладает высокой гибкостью: его можно использовать в качестве тезауруса либо онтологии[источник не указан 2228 дней].

Программное обеспечение

Программы словарей

Для чтения формата XDXF существует большое количество программ под большинство платформ:

Конвертер makedict

Для создания словарей в формате xdxf пока не существует ни единого редактора кроме простых xml-editor’ов, однако в рамках проекта был создан makedict — многофункциональный конвертер форматов «любой в любой»: dictd/dsl/sdict/stardict/xdxf → dictd/stardict/xdxf[источник не указан 2228 дней].

Словари

По состоянию на август 2010, проект содержал 309 свободно распространяемых словарей, суммарным размером 460.16 MiB в сжатом состоянии (и 2 683.04 MiB в несжатом), с 12,488,072 статьями[3]. Однако, до сих пор превалирующее количество свободных и коммерческих словарей остаются неконвертированными в данный формат.

По состоянию на 11.04.2014, репозиторий на сайте проекта XDXF закрыт, и предлагается скачивать словари непосредственно с SourceForge[4], однако в сети имеется по крайней мере один каталог[5], упрощающий поиск по базе словарей, что ранее входило в функции репозитория на сайте проекта.

История

В самом начале разработки формата развивался двумя параллельными путями: XDXF и XDXF-L (образовано от logical). Если первая обладала простой структурой и использовалась чаще всего для создания обычных одноязычных и двуязычных словарей, то вторая — позволяла иметь в словаре огромное количество структурированной информации, по сути превращая его из словаря в словарную базу данных с грамматической, морфологической и лексической информацией. Из-за громоздкости формата, разногласий между авторами и различий в грамматике языков из разных языковых семейств окончательная версия формата так и не была выпущена. Однако XDXF приобрёл развитие и сам разделился на две ветки: визуальное оформление словарных статей и структурно-семантическое, вобравшее в себя сильные стороны XDXF-L[источник не указан 2228 дней].

Примечания

  1. XDXF стал использоваться для хранения различных словарей, однако де факто доминирующим форматом не стал. Что, возможно, связано с тем, что пока не разработан редактор, позволяющий создавать статьи через какой-либо интерфейс, поэтому словари создаются либо с помощью конвертации makedict, либо вручную
  2. Пример предпросмотра словарных статей
  3. XDXF Dictionaries Download (внизу страницы). Дата обращения: 7 августа 2010. Архивировано 14 мая 2006 года.
  4. SourceForge XDXF repository (внизу страницы). Дата обращения: 13 апреля 2011. Архивировано 31 октября 2011 года.
  5. каталог словарей XDXF на сайте Dicto (внизу страницы). Дата обращения: 11 апреля 2014. Архивировано 13 апреля 2014 года.

Ссылки

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.