Воруют контент? Парсят блог?
18 Янв 2010С проблемой воровства контента сталкивались, наверное, очень многие. Не то чтобы эта проблема была обалдеть какой страшной и опасной, но всё равно — приятного же мало.
Авторские права (в том числе и блогерские, в том числе и в интернете) определяет закон «Об авторском праве и смежных правах». Не вдаваясь в юридические подробности, из этого закона можно сделать вывод, что опубликовав самостоятельно написанную статью в сети, вы становитесь обладателем авторских прав на неё без каких-либо оговорок и формальностей (презумпция авторства).
Едем дальше. Как найти плагиаторов? Если воровство материала создаёт вам проблемы, то ответ на этот вопрос вам известен. А если нет, то можете попробовать поискать в поисковых системах заголовки или предложения из своих текстов (можно в кавычках для точного поиска). Или воспользуйтесь специальным сервисом поиска плагиата — CopyScape. Особо «талантливые» парсеры иногда даже присылают трекбэки, по которым их сразу видно.
- Не нашли? Отлично.
- Нашли? Разберёмся.
Первое, что стоит сделать — связаться с владельцем ресурса, на котором размещается краденный контент. Найдите контактную информацию на сайте. Если её нет — проверьте whois этого домена, там может быть телефон и e-mail. Если контакт найден — пишем ему письмо. Вежливость, количество угроз и нецензурной лексики на ваше усмотрение. В 90% случаев вашу просьбу выполнят, зачем им дальнейшие проблемы?
Если контактов нет, вам не отвечают в течение пары дней или вас послали — пора переходить к активным боевым действиям. Вернитесь к whois-данным домена и посмотрите его DNS. Если сайт расположен на виртуальном хостинге, то в качестве NS будут указаны сервера хостинг-провайдера. А чтобы два раза не ходить, посмотрите и код регистратора домена (их расшифровка легко гуглится).
Возможен вариант, что плагиатор использует именные NS, тогда выяснять его сервис-провайдера придётся по IP-адресу. Если кто-то знает для этого сервисы, напишите в комментариях. По-моему что-то подобное умеет показывать сервис Who.is.
Если хостинг-провайдер или регистратор домена мошенника известны — пишите им подробные вежливые письма, указывайте ссылки на оригинал, на плагиат, делайте упор на законодательство. У многих крупных организаций этим занимается отдельная юридическая служба — пишите сразу туда. Хостинг-провайдеры (что с лицензией, что без неё) проблем с законом боятся как огня и решают вопрос как правило в течение нескольких минут.
Если эти два способа не помогли (чего в моей практике вообще не встречалось) — остаётся последний способ, связанный с большим числом заморочек и трудностей — обратиться в правоохранительные органы с заявлением. Если кто-то доходил до этого, то тоже ждём историй.
[…] This post was mentioned on Twitter by Владимир Жилинский, Владимир Жилинский. Владимир Жилинский said: http://zhilinsky.ru/2010/01/18/parsing/ Парсят контент? Тырят тексты? Мочим гадов =) […]
Правоохранительные органы, думаю, ничего вообще делать не будут. Там как-то был рассказ на хабре, как у человека увели деньги с яндекс.кошелька — доказывал сначала яндексу, потом милиции, потом отделению к или как там его — по-моему, итог будет нулевым.
Я пару рас писал письма товарищам, что грабили, пару раз убирали. Кстати, как дополнение к рекомендации я бы советовал размещать в своих постах ссылки на самого себя + в фид отдавать хороший такой футер с копирайтом, ссылками на категории, теги. Большинство ворует по тупому и все ссылки остаются.
Да, у меня именно с этой целью в каждой статье в конце автор и ссылка на блог.
Но такие «простачки» уже отстреляны давно, сейчас иногда всплывают автопарсеры, вырезающие все ссылки, оформленные на Private Person с хитрыми NS. Ничего, тоже «извините, уже убрали» :)
Как новый хостинг появляется, часто видим, что у нас сдернута часть контента или тарифные планы :) Приходится менять с переодичностью раз в полгода..
Особенно мне нравится когда права на авторство качают те кто уже сам свистнул контент :)
По поводу воровства контента ничего вы не докажете даже с объявлением. Газеты друг друга перепечатывают и то там таких разбирательств нету :) хотя там законодательство на много действенней чем в нете.
«юридические подробности, из этого закона можно сделать вывод» а ведь можно и другой вывод сделать.
Любой текст можно выдать за цитату — если есть хоть одна дополнительная ссылка, а если настаивать что типа не оформлена как цитата, то легко ссылается на неграмотность автора оформителя и все.
Я придерживаюсь следующих правил.
1. Если материал интересный, я списываюсь с автором и спрашиваю разрешение о размещении, никто не отказал еще.
2. Если материал так себе, но подходит для массовки, то копирую без зазрения совести.
3. Если ко мне приходит письмо с нормальной просьбой, мол уберите контент пожалуйста, я убираю. Если же пришло ко мне письмо с конкретным матом и грозой, то получает такой же ответ. А еще хуже, делаю сателлит копию сайта, наездника и все. Ибо с начало нужно научиться общаться по человечески, а потом уже права качать.
4. Лично для себя решил, если меня копируют, то расцениваю это как похвалу.
Да в общем-то не об этом и пост. То, что до суда дело ни разу не дошло — уже замечательно. То есть доказывать-то собственно и незачем.
Было дело — у супруги украли фотографию. До суда не дошло, приехали с юристом, объяснили, и получили компенсацию + оплату услуг юриста.
А вообще в эту игру можно играть вдвоем — сливаем сайт врага и кладем слепок на десяток фришных говнохостингов. затем абузим в поисковики, контексты и сапе, если они польузются. Плюс можно пройтись по ссылкам, на которые ведет реклама и отписать мол, «ваша реклама на криминальном ресурсе». Очень, знаете ли, способствует вразумлению особо наглых товарищей 8)
Мне нравятся мысли Санитар’а (жестко, но справедливо). Лучше конечно не доходить до такого (абузы писать не особо хочется), но и свои права следует защищать.
Теория ведения сетевых войн — это отдельная тема :)
Серые методы стоит применять только если полностью исчерпаны белые и пушистые.
Я вообще придерживаюсь мнения, что если каждый вынет голову из песка и вспомнит о своих правах, то всем станет жить немного лучше.
IP-адрес к которому привязан домен можно узнать тут http://2ip.ru/lookup/
Ага, работает.
Но это не слишком полезно — то же самое можно увидеть, сделав ping по адресу сайта.
Вопрос не в том, как определить IP, а в том как найти его владельца.
По zhilinsky.ru, например, в два хода на who.is можно выйти на владельца датацентра — hosteurope.de, но это скорее случайность, а не решение.
ЛОЛ, новый метод борьбы с конкурентами:
1) Копипастим их статью себе на сайт
2) Меняем дату публикации на недалекое прошлое
3) Пишем жалобу хостеру конкурентов
4) Profit!!!
1. Тёмный путь не есть путь истинного самурая.
2. Не прокатит.
— хостер и регистратор проверят копии в кеше поисковиков и отправят вас нафиг.
— если дело дойдёт до суда, то логи провайдера являются доказательством, и вас обвинят в мошенничестве.
Вы правы, но если сайт жертвы индексируется поисковиками не очень шустро, копипастим самую свежую статью, размещенную несколько часов назад, закупаем ссылки через какую-нибуть SAPE на свежескопированную статью, чтобы она быстренько проиндексировалась, Profit!
Ну, это если вы избрали темную сторону силы :)
А по поводу суда — походу вас обвинить и даже найти не смогут, если домен и хостинг зарегистрирован на левые контакты, но мне интересны ваши мысли по этому поводу.
Делая так вы переходите на другую сторону баррикад, становясь плагиатором. Эта статья — о том, как с вами разобраться :)
Если у вас домен зарегистрирован на левые данные — его легко потерять (у меня сейчас чуть больше сотни таких отобрано), хостинг тоже быстро кончится… Так что лучше оставаться на светлой стороне.
Домен на левые данные — значит заплатит левый человек или регистратор, не проверивший документы. Ну это только в случае .ru
С рушками стало получше — левые не проходят проверку, которую можно запустить через регистратора. Но есть же ещё куча всяких biz, info, name…
У них от регистратора зависит. Godaddy, например весьма жёстко реагирует на заявления о плагиате, спаме и порнографии. Просто домены и хостинг отнимает не возвращая денег.
Действенным будет оставление на изображениях своего логотипа. Это для защиты от воров картинок, ну а заодно и самого конетента, так как что за текст, если в нем изначально отсутсвуют картинки или на них чужой логотип.
Не очень. Большая часть парсеров вырезает картинки автоматически, а если воруют вручную — заменят и картинку.
Да и ссылка\логотип на картинке абсолютно параллельны поисковым системам, а плагиаторы как правило борются именно за их внимание.
Да нуууу, хороош! ИМХО когда воруют контент нужно только радоваться и прыгать от счастья — ваш контент хоть кому-то интересен! :)
Мне лично пофик на тех, кто контент мой ворует, я сам чаще всего раскидываю его где попало. Оригинал естественно остаётся на моём блоге а Google, поверьте, всегда знает где оригинал а где копия ;)
Пускай картинки вырезают, ссылки вырезают, автора не указывают.. Да какая разница? Вы больше времени тратите на поиски и устранения плагиата, лучше бы в это время ещё один интересный пост написали ;)
При всём уважении ;)
~ K.
А по поводу привязанности IP адреса к хостингу очень просто. Если у человека shared хостинг, то вбиваем его IP адрес в Bing.com и получаем все остальные сайты находящиеся на этом хостинге, а у них можно и спросить ;)
Например ip:87.230.100.98 вывел 5 страниц ваших «соседей» ;)
Кстати, ip адрес можно узнать командой nslookup в командной строке, а командой dig можно вообще просмотреть все записи DNS (в то числе и почту) для опр. домена, правда не уверен что есть dig для винды, хотя должен быть..
Гугл знает, а у Яндекса с этим не всё так гладко.
Мнение понял, оно вполне логично.
На самом деле мне просто нравится создавать проблемы людям, которые пытаются посидеть у меня на шее :)
Дык )) ну вот это уже совсем другое дело, ради интереса и попортить «злоумышленникам» настроение это дааа, хотя в таком случае да, сперва нужно просить ссылку на оригинал + ссылку на сайт автора.. Ну, чтобы хоть какая-то выгода была ;)
А, кстати, некоторые уже после первого «атата» просто ставят сквозняк на сайте типа «Источник информации» и парсят дальше уже вполне лицензионно :)
«Если хостинг-провайдер или регистратор домена мошенника известны — пишите им подробные вежливые письма» — хостинг-провайдер заблокирует сайт плагиатора только по решению суда (других вариантов нет), об этом нужно знать.
Про детское порно и спам это совсем другой вопрос, здесь доказывать авторство в суде не требуется.
Не в тему: ваш информер не показывает тИЦ, тот который здесь:
http://zhilinsky.ru/checkpr/
На странице этой записи он также показывает 0
Нифига подобного. Метод работает.
А у информера скоро пройдёт =)
2 вопроса к «Konstantin»:
1) Что можно спросить (или о чём) у соседей по шаред-хостингу? Кто хостер или кто владелец сайта?
2) Какой такой e-mail покажет dig? Не тот ли, что в SOA записи? Чаще всего этот e-mail принадлежит техподдержке Name-серверов, отвечающих за зону для домена.
@jump: 1. можно спросить кто хостер, 2. не е-майл а записи для е-майл в DNS, т.е. MX записи, откуда можно узнать где их почта хостится.
Узнать где почта хостится и спамить по словарю? Не очень удобно, ну да ладно, я Вас понял.
Я пошел по другому. У меня сестра адвокат, и я с ее помощью подал в суд вчера на админов ГОВНОсайтов 1000hit и addfiles на ucoz.ru за что что берут контент с сайт increaseblog.ru. Дело будет рассматриваться несколько месяцев. Но зато…Но зато… мало админам этих ГОВНОсайтов не покажется