Сегментация текста, выделение предложений

C/C++:

HGREN_SBROKER sol_CreateSentenceBrokerMemW( HGREN hEngine, const wchar_t * Text, int LanguageID )

HGREN_SBROKER sol_CreateSentenceBrokerMemA( HGREN hEngine, const char * Text, int LanguageID )

HGREN_SBROKER sol_CreateSentenceBrokerMem8( HGREN hEngine, const char * TextUtf8, int LanguageID )

C#:

IntPtr sol_CreateSentenceBrokerMemW( IntPtr hEngine, string Text, int LanguageID )

Delphi:

function sol_CreateSentenceBrokerMemW( hEngine: PInteger; Text: PWideChar; LanguageID: Integer ): PInteger;

function sol_CreateSentenceBrokerMemA( hEngine: PInteger; Text: PAnsiChar; LanguageID: Integer ): PInteger;

function sol_CreateSentenceBrokerMem8( hEngine: PInteger; TextUtf8: PAnsiChar; LanguageID: Integer ): PInteger;

PHP:

sol_CreateSentenceBrokerMem8( $hEngine, $TextUtf8, $LanguageID )

Аргументы:

hEngine - дескриптор экземпляра грамматического словаря.

Text - указатель на строку с текстом, который будет разделен на предложения. Для функций с суффиксом W это строка из широких символов, для A - из однобайтовых в текущей кодировки, для 8 - в кодировке utf-8.

LanguageID - ID языка, правила которого нужно применять для сегментации и токенизации, либо -1.

Возвращает:

Дескриптор перечислителя, который позволит последовательно получить текст каждого выделенного предложения.

Примечания

Процедура выполняет разбивку текста на предложения с использованием правил для указанного языка.

Возвращаемое значение является дескриптором специального объекта, который указывается в вызовах функций sol_FetchSentence, sol_GetFetchedSentenceLen, sol_GetFetchedSentence[W,A,8].

После того, как все предложения извлечены, следует удалить объект перечислителя предложений с помощью вызова sol_DeleteSentenceBroker.

См. подробное описание алгоритмов токенизации.

Примеры

C++:

// ...

C#:

...

PHP:

Навигация по API грамматического словаря

Приобретение SDK грамматического словаря

API layer C++ source code: grammar_engine_api.cpp

Вернуться к списку функций API

  © Козиев Илья 2019
изменено [an error occurred while processing this directive]