Антимат на PHP
16 Июн 2007Программист Rinat Nasibullin по-своему решает проблему с матом в интернете. И предлагает готовое действующее решение всем желающим.
Он написал функцию на PHP, которой в качестве параметра передаётся строка с русским текстом в UTF-8, а на выходе она даёт либо false (мата нет), либо string — строку с найденными словами, которые программа сочла неуместными.
Алгоритм достаточно надежен и быстр, в т.ч. на больших объемах данных. Метод обнаружения мата основывается на корнях и предлогах русского языка, а не на словаре.
Скачать эту антимат-функцию можно здесь.
А не проще ли просто портировать перловый модуль ?
http://matotest.43n39e.ru/
Можно… Хотя некоторые всё равно сомневаются в оправданности применения данных модулей. Некоторые слова всё равно двойственные, например, родительный падеж от существительного «СУЧЁК».
Я думаю, есть смысл использования таких модулей для проверки, а не для блокировки.
кроме проверки и блокировки есть корректировка — вполне себе здравый подход.
Я бы ещё предложил вариант пометки на просмотр модератору\владельцу ресурса уже после публикации.
Все это конечно прекрасно… только вот стоит так усердствовать и бороться с матом.. в конце-концов — это неотъемлимая часть русского языка
Ну не все могут себе это позволить и не везде это разрешено.
[…] содержания веб-ресурсов. У Владимира Жилинского про анализатор текста на наличие русского мата. У Никиты Селецкого идея о создании алгоритма анализа […]
На одном форуме по PHP шло долгое обсуждение этой темы, все свелось к тому что без ручной проверки никак :( особенно пример со словом «Шумахер» понравился… когда после обработки его скриптом-фильтром что-то типа «Шумах~р»… Один авто-форум с таким фильтром работал потом выкинули его «нафик» посты трудно читаемые получались. А разрешать употреб~~~ь :) мат мне кажется всетаки не стоит.
Случаи а-ля Шумахер в перловом модуле решаются исключениями (как в ту, так и в другую сторону), и не надо ничего выкидывать, да и вообще пороть горячку…
Всё хорошо в меру -_^
[…] к заметкам о морфологическом антимат-фильтре на PHP, функциях для экстренного конвертирования в UTF и […]
[…] к заметкам о морфологическом антимат-фильтре на PHP, функциях для экстренного конвертирования в UTF и […]