Лингвистика - полезные ссылки

О ссылках

Собранные здесь ссылки на ресурсы ни в коем случае не должны рассматриваться как некий исчерпывающий обзор по затрагиваемым темам. Ссылки собираются по мере решения вполне конкретных задач в рамках проекта по созданию поискового движка (например - ресурсы по китайскому и японскому языкам), поэтому некоторые полезные ресурсы могли быть пропущены. Кроме того, в связи с технической направленностью проекта сюда попадали преимущественно ссылки на ресурсы, которые полезны скорее программистам, нежели гуманитариям.

Я продолжаю искать ссылки на ресурсы Сети и электронные документы, посвященные языкам народов России. К сожалению, в силу отсутствия коммерческой заинтересованности авторов в Интернете научных ресурсов, посвященных языкам малых народов России, практически нет (достаточно сравнить с засильем ресурсов, посвященным английскому языку). Мой интерес к языкам народов России тоже является некоммерческим. Определенная часть программного обеспечения, разработанного в рамках проекта, может быть использована для некоторых исследований текстов на естественных языках (см. например описание программы empir), и мне хотелось бы получить результаты не только для "мэйнстримовых языков" - русского, английского, других европейских, но и для малоизвестных.

Надеюсь со временем собрать некоторый материал для обработки по нашим братским языкам - татарскому, например (напомню французскую пословицу "поскреби русского и увидишь татарина"). Конечно, под братскими языками я подразумеваю не лингвистическое родство, а историческое.

UNICODE и все о представлении символов

В процессе разработки поисковой машины постоянно возникали вопросы технического плана, связанные с одновременной обработкой текстов на многих языках. Среди возможных решений оптимальным является использование стандарта UNICODE (хотя у него есть малоизвестные альтернативы). При реализации алгоритмов мы старались придерживаться стандарта, в частности за счет использования сторонних open-source библиотек и официальных материалов с сайта консорциума разработки Unicode. Вы можете посмотреть на результаты этой работы - скриншоты поисковой системы при работе с текстами на разных языках, а также увидеть примеры использования юникода в запросах.

www.unicode.org - всевозможные таблицы по представлению символов в стандарте UNICODE

www.unicode.org/onlinedat/resources.html - полезные ссылки по программным библиотекам для поддержки UNICODE

en.wikipedia.org/wiki/ISO_8859 - Описание стандарта iso 8859 - кодовые страницы - в Википедии

www.i18nguy.com/unicode/codepages.html#msftwindows - много информации для программистов по Юникоду

www.suncloud.ru/workshop/wdhplus/encoding/encoding2.htm#unicode - неплохой вводный курс Юникода на русском языке

www.ibm.com/software/globalization/icu/downloads.jsp - open-source библиотека IBM ICU для выполнения i18n программ

Языки

Мы разрабатывали архитектуру поисковой машины с прицелом на многоязыковое использование, которая включает в себя не только локализацию пользовательского интерфейса (см. скриншоты поисковой системы Integra), но и возможность одновременного поиска информации в документах, содержащих тексты на разных языках (то есть в том числе использующих разные алфавиты). Обратите внимание, что решение этой задачи непосредственно связано с реализацией юникода, поэтому ссылки на релевантные ресурсы сведены в одну страницу.

Русский язык

slovari.gramota.ru/ - Словари русского языка на сайте Грамота.ru

Общественно-научный проект "Языки русских городов" - возможность "перевода" диалектных слов, употребляемых в разных местностях России.

Корпус русского языка - научный проект, посвященный современному русскому языку (лексика и грамматика).

typo.mania.ru/glossary/ - глоссарий по типографским терминам (в том числе всевозможные названия диактрических символов и т.п.)

http://miresperanto.narod.ru/o_russkom_jazyke.htm - познавательный материал по русскому языку

Французский язык

Статья о французском языке в Википедии

Подборка ссылок на сайте Ильи Франка - там есть книги, словари, грамматика для скачивания

Японский язык

Статья о японском языке в Википедии

www.csse.monash.edu.au/~jwb/japanese.htm  - Сайт Джима Брина о японском языке - словари, грамматика и т.д. См. также каталог FTP-архива http://ftp.cc.monash.edu.au/pub/nihongo/00INDEX.html

anime.dvdspecial.ru/Japan/hiragana.shtml - О японской слоговой азбуке "хирагана"

www.sensi.org/~alec/lang/japan/encoding.html - Сетевые кодировки японского языка (рус)

lfw.org/text/jp.html - Japanese text encoding (eng)

www.popjisyo.com/WebHint/Portal_e.aspx - online-переводчик для японских (и китайских) веб-сайтов

Китайский язык

www.omniglot.com/writing/chinese.htm - китайское письмо (англ)

Статья о китайском языке в Википедии

www.papahuhu.com/lessons - Папа ХуХу - сайт о китайском языке (на русском)

chinesecomputing.com.hosting.domaindirect.com/ - обработка текста на китайском языке (для программистов)

home.att.net/~jameskass/chiradtest.htm - китайские радикалы (таблица в utf8)

www.mandarintools.com/ - online Chinese tools (включая перевод между китайским и английским)

www.popdict.com/rdict_chinese.htm - словари для скачивания

www.chinalanguage.com/ - информация по языку

Грузинский язык

members.tripod.com/ggdavid/georgia/language/index.htm

Белорусский язык

www.belarus-misc.org/bel-ling.htm#ling

Идиш

www.franklang.ru/idisch.html - подборка ссылок на ресурсы по идиш (включая словари для скачивания) на сайте Илья Франка

Арабский язык

www.omniglot.com/writing/arabic.htm - арабский язык

Греческий язык

www.omniglot.com/writing/greek.htm - базовая информация о греческом языке (англ)

greek-language.com/

Английский

http://miresperanto.narod.ru/pri_angla.htm - познавательные материалы

Финский

http://www.henkimaa.nu/finndex/suomea/learning/grammar.html - грамматика языка и ссылки на ресурсы (на англ.)

Другие языки. Словари.

ispell-fi.sourceforge.net/ ispell-fi: finnish spell checking dictionary for ispell

stardict.sourceforge.net/ - StarDict - cross-platform and international dictionary written in Gtk2

www.helsinki.fi/~hkantola/dict.html - бесплатные словари online и для скачивания

sourceforge.net/projects/xdxf/ - проект XML Dictionary Exchange Format. Есть много словарей для скачивания.

Статьи о тайском языке и тайском алфавите в Википедии

www.trigeminal.com/samples/provincial.html - "Почему они просто не говорят по-английски?" - примеры перевода на многие языки

www.columbia.edu/kermit/utf8.html - примеры перевода фразы на многие языки

crism.maden.org/dunno.html - еще примеры перевода фразы на многие языки

home.freeuk.net/cadenza/chunky-monkey/ - "Chunky monkey had a cow" на разных языках

www.omniglot.com/babel/ - перевод истории о вавилонской башне на разные языки

salrc.uchicago.edu/resources/fonts/main.html - South Asia languages resource centre

www.franklang.ru/f.html - на сайте проекта Ильи Франка можно найти море информации по  многим языкам

www.freelang.net/dictionary/index.html - программа-переводчик (free) и словари для скачивания

http://www.lingvisto.org - языковая энциклопедия "Лингвисто" краткая информация о разных языках

http://en.wikipedia.org/w/index.php?title=Latin_alphabet&oldid=27131663 - о латинском алфавите и его модификациях в Википедии

http://miresperanto.narod.ru - много познавательной информации по английскому, русскому, эсперанто и другим искусственным языкам

Разное

http://wikisource.org/wiki/Main_Page - Викитека - свободная библиотека с текстами на разных языках

Искать, найти, затем — связаться! - языки для общения с другими цивилизациями (Журнал "Знание-Сила")

http://www.ling.yale.edu/~elf - фонд исчезающих языков

http://cbook.ru/peoples/class/lingv1.shtml - лингвистическая классификация народов

http://www.eki.ee/books/redbook/ - красная книга народов России (англ)

http://www.smo.uhi.ac.uk/saoghal/mion-chanain/en/ - языки малых народов Европы

 

 

Как предложить ссылку в каталог

Предложения по добавлению ссылок в каталог - шлите электропочтой.

Также с удовольствием пообщаемся в нашем форуме

последние изменения 10.08.2007

  © Mental Computing 2010