Mystem
Wrapper for Yandex mystem morphological analysis program
Install / Use
/learn @aotd1/MystemREADME
Использование Mystem
Простая обертка для Yandex mystem. Работает исключительно с русской морфологией.
Разрабатывалась для определения ненормативной лексики в текстах, но вполне подойдет и для стемминга и морфологического анализа.
Установка
Библиотека доступна в Packagist (aotd/mystem) и устанавливается через Composer.
php composer.phar require aotd/mystem 'dev-master'
Никто не запрещает просто скачать исходники с GitHub и использовать любой PSR-0 автолоадер.
Использование
Все примеры собраны в папке examples.
- antimat - проверка текста на наличие обсценной лексики.
- jabberwocky - стемминг части стихотворения «Бармаглот» (в переводе Дины Орловской).
- verb-tense - определение времени глагола
Использование с Yii
Устанавливаем библиотеку через composer
{
"require": {
"aotd/mystem": "dev-master"
},
"scripts": {
"post-install-cmd": [ "MystemBinaryInstaller::install" ],
"post-update-cmd": [ "MystemBinaryInstaller::update" ]
},
}
$ composer install
Секция scripts необходима для установки бинарного файла mystem от Яндекса в зависимости от целевой платформы (Win/Mac OS/Linux/FreeBSD)
Складываем ExtMystem.php в /protected/extensions/Mystem, добавлеям в конфиг в секцию components:
...
'mystem' => array(
'class' => 'ext.Mystem.ExtMystem',
// 'falsePositive' => __DIR__ . '/mystem/false-positive.txt',
// 'falsePositiveNormalized' => __DIR__ . '/mystem/false-positive-normalized.txt',
// 'falseNegative' => __DIR__ . '/mystem/false-negative.txt',
// 'falseNegativeNormalized' => __DIR__ . '/mystem/false-negative-normalized.txt',
),
...
Опционально указываем списки ложно-положительных, ложно-отрицательных слов для фильтра обсценной лексики...
Yii::app()->mystem->checkArticle('Текст для проверки на наличие матов');
Profit!
P.S. Никто не отменяет великость и могучесть русского языка, потому всецело доверять такому решению не стоит :)
Related Skills
node-connect
342.5kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
85.3kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
342.5kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
342.5kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。



