Регулярные выражения (regexp)

18 комментариев

Регулярные выражения (regexp)

Регулярные выражения (regexp, англ. regular expressions, жарг. регэкспы или регексы) — современная система поиска текстовых фрагментов в электронных документах, основанная на специальной системе записи образцов для поиска.

Вдогонку к моей заметке про регулярные выражения нашлось ещё несколько полезных ссылок на новые сервисы автоматической проверки и конструирования регэкспов.

  • Шпаргалка по регулярным выражениям — на стенку.
  • RegexPal: Скрипт, который позволяет на лету создавать и проверять паттерны регэкспов средствами JavaScript. Подсвечивает синтаксис и содержит подсказки. Кстати, этот скрипт можно сохранить — он работает независимо от сервера.
  • Regexp.ru: Проверяет регэкспы средствами PHP (preg_match_all).
  • Rexv.org и REGex Tester: Проверяют регэкспы средствами PCRE, POSIX или JavaScript.
  • Java Regexp: Проверяет регэкспы на Java.

Спонсор: Есть работа!: О кредитах на приобретение жилья человеческим языком.

Жилинский Владимир.



Интересные факты о Google

10 комментариев

Интересные факты о GoogleGoogle таит много забавных и интересных секретов. Знаете ли вы, что:

  • В качестве названия для Google был взят математический термин, — число равное единице со 100 нулями. Потом выяснилось, что оно пишется по-другому — «googol«. Несмотря на это, было решено оставить название «Google». Да и чек инвестора уже был выписан на такое название компании.
  • Алгоритм ранжирования назван Page Rank, не от слова Page (страница), а от фамилии Ларри Пейджа — одного из основателей Google. Скорее всего.
  • В 1998 году Сергей Брин и Ларри Пейдж предлагали Yahoo! купить Google вместе с PageRank за $1 000 000. Yahoo отказалось. В 2005 году Google стоила уже 80 миллиардов долларов, а годовая прибыль компании составила 1,5 миллиарда.
  • Даже после того, как Сергеем Брином и Ларри Пейджем у инвесторов были получены более чем 25 миллионов долларов, они все еще не знали, как они будут зарабатывать деньги. У них была только поисковая система и уверенность в своих силах.
  • В Google существует «правило 20%«: программисты вольны 20% своего рабочего времени посвящать тем проектам, которые интересны лично им.
  • Автор известного логотипа Google — Сергей Брин. А праздничные логотипы рисует художник Деннис Хванг.
  • Девиз Google — «Не навреди» (варант перевода — «не делай зла»). Этот же девиз считается первым правилом врача. Второе правило врача: «помоги».
  • Google владеет доменом Foofle.com и с него стоит переадресация на Google.com. Для опечатавшихся.
  • Google умеет производить пересчет единиц измерения (калькулятор). Для этого в окно поиска надо ввести запрос следующего формата: «1 мл в литрах» или «1 километр в мм». Google также понимает, скольким квадратным попугаям равен 1 удав или световой год.
  • Google понимает более 100 языков. Кроме украинского, русского, английского, греческого, латыни, гэльского, хинди, зулусского, эсперанто, персидского, арабского, иврита, и многих других языков, Google также понимает язык повара Борк-Борк-Борка из «Маппет-шоу», язык расы инопланетян с планеты Клингон, персонажей сериала Star Trek, наречие Элмера Фуда (из мультика про Багса Банни) и древний полушуточный хакерский язык leet (1337).

Заметки по теме:

Спонсор: RSS2Email - простая и эффективная реклама блогов.



Сегодня — Международный день числа «Пи»

2 комментария

В американском написании сегодняшняя дата выглядит как 3.14, отсюда и объяснение, почему именно в этот день отмечается день числа «Пи«. Так же в этот день родился А. Энштейн (14 марта 1879).

Сегодня - Международный день числа ПиЧисло π (произносится «пи») — математическая константа, выражающая отношение длины окружности к длине её диаметра. Обозначается буквой греческого алфавита «пи».

Число π впервые возникло в геометрии как отношение длины окружности к длине её диаметра, однако оно появляется и в других областях математики. Число π иррационально и трансцендентно.

Впервые обозначением этого числа греческой буквой π воспользовался британский математик Уильям Джонс (1706), а общепринятым оно стало после работ Леонарда Эйлера. Это обозначение происходит от начальной буквы греческих слов περιφέρεια — окружность, периферия и περίμετρος — периметр.

Я думаю, день рождения великого гения, день трансцендентного числа, да ещё и пятница — отличный повод отдохнуть и расслабиться.

Жилинский Владимир.



Народ.Диск — новый файловый хостинг от Яндекса

9 комментариев

Яндекс запустил новый сервис — Народ.Диск. Это файловое хранилище, в которое можно бесплатно закачать свои файлы для того, чтобы хранить их там, давать ссылки другим людям для скачивания, использовать их как резервные копии или для передачи между домом и работой.

Новый сервис реализован в рамках древнего проекта Яндекса — сервиса бесплатного хостинга Narod.ru, но чтобы им воспользоваться достаточно иметь обычную учетную запись Яндекса.

Народ: Диск

Общий объем и количество пользовательских файлов на Народ: Диск не ограничено. Срок хранения каждого файла составляет 3 месяца, однако его можно бесконечно продлевать. Он так же продлевается автоматически при скачивании файла.

Максимальный размер одного файла — один компакт-диск (около 750 МБ). Народ: Диск поддерживает функцию докачки и множественное скачивание, а многопоточность — нет.

Для истории: на данный момент возле логотипа проекта красуется надпись «бета» и по статистике на нём всего 394 файла.

Жилинский Владимир.



Морфологический анализатор для PHP-скриптов

24 комментария

Морфологический анализатор для PHP-скриптовДолго мы ломали над этим голову… Морфология русского языка весьма сложная штука в плане алгоритмизации. Но использование в практически любом проекте морфологизатора, например, для поиска или подбора — даёт проекту неплохой бонус в удобстве использования.

Самый удачный, быстрый и простой в использовании морфологизатор я нашёл совсем недавно. Это phpMorphy. и он умеет следующее:

  1. Определение словоформ слова;
  2. Определение корня слова;
  3. Определение начальной формы слова.

Если нужно реализовать поиск с учётом словоформ, то это совсем просто — нужно просто получить корень слова с помощью phpMorphy ( $root = $morphy->getPseudoRoot($words); ) и провести поиск по базе данных SQL-оператором LIKE.

Сам скрипт занимает не больше 30 Kb, а русский словарь для него - 2.5 Mb.

Справедливости ради отмечу, что рассматривались и другие морфологические скрипты.

Жилинский Владимир.



Хостинг за полцены

17 комментариев

ISPserver.comНе так давно я писал про компанию ISPServer, которая предлагает различные виды хостинга по вкусным ценам.

Сегодня мне сообщили, что этой весной у них юбилей — 10 лет. Довольно серьёзная цифра для компании, работающей в отрасли, где даже 3 года считается большим опытом работы.

В честь этого они расщедрились на подарки: и домены начали дарить всем подключающимся, и бэкапы серверов ежедневные делать, подарки на праздники разыгрывать.

Дальше — больше — теперь всем купившим обычный виртуальный хостинг до 31 марта будет сделана скидка в 50% на весь период хостинга. То есть грубо говоря — пожизненно. И скидка распространяется не только на абонентскую плату, но и на все дополнительные услуги.

Новости компании ISPServer.

А я, работая с клиентскими сайтами, занёс ещё один хостинг в свой чёрный список — Gudzon Host: укуренное управление, устаревший софт, невменяемая техподдержка.

Жилинский Владимир.



Sun Tech Days 2008 в Петербурге

5 комментариев

Компания Sun Microsystems организует в Санкт-Петербурге 2-4 апреля свою конференцию для разработчиков Sun Tech Days 2008. Она пройдёт в ДС «Юбилейный» на пр. Добролюбова, 18 (ст. м. «Спортивная»).

Sun Tech Days 2008 в Петербурге

Sun Tech Days — это крупнейшая международная конференция по технологиям Java и Solaris в России и место встречи для всех тех, кто занят в разработке и использовании современных информационных технологий — разработчиков и системных администраторов, научных работников, студентов и преподавателей. Это возможность узнать что-то новое о современных технологиях и технологиях завтрашнего дня, получить практические навыки их применения, задать вопросы напрямую создателям технологии, а также встретиться и пообщаться с коллегами, работающими в этой области.

Программа конференции включает более 60 докладов и мастер-классов по Solaris, JavaFX, JavaCard, Netbeans, Java SE, Java ME и Java EE, а также наиболее крупным открытым платформам Sun Microsystems — GlassFish, PhoneME и OpenJDK. С докладом о своём новом проекте в Sun выступит специальный гость конференции, автор Debian Ян Мердок (Ian Murdock). Участие в мероприятии бесплатно.

Спонсор: Novate - 40 лучших дизайнерских обзоров зимы. Тема дизайна - раскрыта.

Жилинский Владимир.



Определяем Google PR и Яндекс ТиЦ в PHP

25 комментариев

PHPВот несколько простых функций, которые позволяют скрипту получить значения классических пузомерок (ТиЦ, PR) для страницы или сайта средствами PHP, может кому-нибудь пригодятся. Не требуют от сервера ничего сверхъестественного — PHP и возможности внешних соединений будет вполне достаточно.

скачать PHP скриптGetPR.phps — получение Google PR в виде числа.

скачать PHP скриптGetCY.phps — получение тулбарного Яндекс ТиЦ в виде числа.

Ещё Яндекс ТиЦ можно получить из каталога в виде картинки вот таким образом:

<img src=http://www.yandex.ru/cycounter?$uri>

Картинка, взятая по этому адресу покажет favikon`ку сайта, закешированную Яндексом.

<img src=http://favicon.yandex.net/favicon/$uri/>

$uri в этих примерах — нужный адрес сайта без http:// и www.

Посмотреть как это всё работает и сколько времени на это уходит можно вот на этом скрипте, который работает именно таким образом.

Спонсор: Мегаплан, удобная система управления задачами.

Жилинский Владимир.

«Недосол – на столе, пересол – на спине» — гласит русская народная поговорка. Но, что делать если пересолил? Можно ли спасти пересоленное блюдо?



Журнал «Терминал Ру»

16 комментариев

Журнал Терминал РуПоявился и доступен для скачивания первый номер журнала для SEO и вебмастеров Терминал Ру. На сайте можно скачать его в виде 4Мб PDF-файла или заказать бесплатную подписку (до 10 числа). Журнал будет распространяться бесплатно весьма удобными способами (всем известна любовь интернетчиков к халяве):

  • Бесплатная подписка
  • Стойки в офисах крупнейших хостеров
  • Конференции, неформальные вебмастерские мероприятия.

«Тематика журнала – это все, что может быть интересно владельцу сайта: актуальные события отрасли, технологии привлечения и удержания аудитории, SEO, реклама, PR, железо, софт, финансы, монетизация проектов, защита информации, законодательство и многое другое» — пишет главный редактор Роман Доморенок, руководитель ЦОП РСЯ ADmeans.

Тираж первого номера 3000, но создатели надеются довести его до 10 тысяч, не считая онлайн-версии в PDF. Выпускать журнал планируется каждые 2 месяца.

После прочтения PDF-версии определённо захотелось заполучить бумажный вариант — читать журналы с экрана некомфортно и получается как-то бегло. Но темы в первом номере освещены весьма интересные.

Спонсор: Эскхостинг - хостинг для блога с предустановленным WordPress. Нам отдают предпочтение самые успешные блоггеры Рунета.

Жилинский Владимир.



РИФ-2008 и РИТ-2008. Не путать.

9 комментариев

В апреле интернет-специалистов ждёт сразу два крупных события — РИФ-2008 (Российский Интернет-Форум) и РИТ-2008 (Российские Интернет Технологии).

РИФ-2008

12-й Российский Интернет-Форум (РИФ-2008) пройдёт 3-4 апреля по сложившейся традиции в подмосковном пансионате «Лесные дали».

Основное внимание в этом году будет уделено теме интернет-сообществ и социальных сетей. Впрочем, традиционные темы (телеком, маркетинг, реклама, технологии, информационная безопасность, частно-государственное партнерство и др.) также будут широко представлены в программе.

Организаторы сохраняют главные принципы участия в форуме: бесплатное участие для докладчиков и слушателей, доступность мероприятий Форума для региональных участников и отсутствие коммерческого давления на программу Форума.

РИТ-2008
Конференция «РИТ-2008» пройдет 14-15 апреля в бизнес-центре «Крокус-Экспо».

Программа конференции состоит из шести секций: разработка больших сайтов, серверное программирование, клиентское программирование, базы данных, технологии будущего, качество. Доклады по темам бизнес в веб-разработке, управление командами и управление проектами пройдут в рамках вложенной миниконференции SuccessStory — 2008.

Участие в конференции РИТ-2008 платное, и на данный момент стоимость составляет 7000 рублей и по мере приближения даты конференции будет увеличиваться. Всего на РИТ-2008 планируется принять не более 1500 человек.

Я к сожалению не смогу посетить обе конференции, и скорее всего выберу РИФ. Кто-нибудь ещё планирует его посещение?

Жилинский Владимир.




© 2007-2010 Блог интернет-разработчика, автор — Zhilinsky.ru.
При использовании информации ссылка на источник обязательна.