Антимат на PHP

16 Июн 2007

Антимат скрипт - фильтр мата на PHPПрограммист Rinat Nasibullin по-своему решает проблему с матом в интернете. И предлагает готовое действующее решение всем желающим.
Он написал функцию на PHP, которой в качестве параметра передаётся строка с русским текстом в UTF-8, а на выходе она даёт либо false (мата нет), либо string – строку с найденными словами, которые программа сочла неуместными.

Алгоритм достаточно надежен и быстр, в т.ч. на больших объемах данных. Метод обнаружения мата основывается на корнях и предлогах русского языка, а не на словаре.

Скачать эту антимат-функцию можно здесь.

Жилинский Владимир.






 

Maxime     .

Написано 17 июня 2007 года в 18:10


А не проще ли просто портировать перловый модуль ?
http://matotest.43n39e.ru/

 

Жилинcкий Владимир     .

Написано 17 июня 2007 года в 18:27


Можно… Хотя некоторые всё равно сомневаются в оправданности применения данных модулей. Некоторые слова всё равно двойственные, например, родительный падеж от существительного “СУЧЁК”.
Я думаю, есть смысл использования таких модулей для проверки, а не для блокировки.

 

Maxime     .

Написано 17 июня 2007 года в 21:20


кроме проверки и блокировки есть корректировка – вполне себе здравый подход.

 

Жилинcкий Владимир     .

Написано 17 июня 2007 года в 21:26


Я бы ещё предложил вариант пометки на просмотр модератору\владельцу ресурса уже после публикации.

 

Димка Сео     .

Написано 19 июня 2007 года в 11:06


Все это конечно прекрасно… только вот стоит так усердствовать и бороться с матом.. в конце-концов – это неотъемлимая часть русского языка

 

Жилинcкий Владимир     .

Написано 19 июня 2007 года в 11:37


Ну не все могут себе это позволить и не везде это разрешено.

 

Varia: Интересные факты - Блог Сергея Третьяка     .

Написано 22 июня 2007 года в 20:23


[…] содержания веб-ресурсов. У Владимира Жилинского про анализатор текста на наличие русского мата. У Никиты Селецкого идея о создании алгоритма анализа […]

 

Denis     .

Написано 2 июля 2007 года в 03:34


На одном форуме по PHP шло долгое обсуждение этой темы, все свелось к тому что без ручной проверки никак :( особенно пример со словом “Шумахер” понравился… когда после обработки его скриптом-фильтром что-то типа “Шумах~р”… Один авто-форум с таким фильтром работал потом выкинули его “нафик” посты трудно читаемые получались. А разрешать употреб~~~ь :) мат мне кажется всетаки не стоит.

 

Maxime     .

Написано 2 июля 2007 года в 11:06


Случаи а-ля Шумахер в перловом модуле решаются исключениями (как в ту, так и в другую сторону), и не надо ничего выкидывать, да и вообще пороть горячку…

 

Жилинcкий Владимир     .

Написано 2 июля 2007 года в 17:34


Всё хорошо в меру -_^

 


[…] к заметкам о морфологическом антимат-фильтре на PHP, функциях для экстренного конвертирования в UTF и […]

 


[…] к заметкам о морфологическом антимат-фильтре на PHP, функциях для экстренного конвертирования в UTF и […]

Оставить комментарий:

You must be logged in to post a comment.

© 2007-2010 Блог интернет-разработчика, автор — Zhilinsky.ru.
При использовании информации ссылка на источник обязательна.