Home

Previous Entry | Next Entry

SEO Critic

Оригинал записи находится здесь - SEO Критик.Комментарии к записи вы можете оставить в этом ЖЖ или здесь.

Как напарсить больше 1000 ссылок в Google - практические советы.

Итак, в процессе работы или обучения перед многими возникает такой вопрос: “Google ведь отдает всего 1000 ссылок, как напарсить больше?”

1. Пользуйтесь хорошим парсером - из бесплатно распространяемых десктопных автопарсеров пока мне больше всех нравиться AGGRESS парсер (скачать можно здесь). Из ручных - AllSubmitter.

2. Изучите операторы Google и других ПС т.к. возможности своих рабочих инструментов нужно знать досконально. Для этого рекомендую почитать интересную, пускай и 2004 года, книгу Google Hacks

Теперь перейдем к конкретике:

1. Используйте поиск по разным доменным зонам. Например:

“Powered by phpBB” site:com
“Powered by phpBB” site:net
“Powered by phpBB” site:org
“Powered by phpBB” site:biz
“Powered by phpBB” site:de
“Powered by phpBB” site:info
“Powered by phpBB” site
“Powered by phpBB” site:nu
“Powered by phpBB” site:ws
“Powered by phpBB” site:en
“Powered by phpBB” site:.nl
“Powered by phpBB” site:it
“Powered by phpBB” site:us

В идеале для каждого такого запроса мы получим по 1000 результатов из разных доменных зон

2. Используйте оператор “+”. Например, мы можем сделать такие поисковые запросы:

“Powered by phpBB” +bank
“Powered by phpBB” +ball
“Powered by phpBB” +money
“Powered by phpBB” +jewel

И в результате получим страницы содержащие наш запрос и указанное слово. Специально для подобных целей я собрал в табличку общеупотребительные слова английского языка. Скачать можно здесь Естественно в процессе работы каждый может расширить этот документ в соответствии со своими потребностями

3. Если уж срать по форумам, то лучше срать по тематическим - больше шансов, что пост выживет и для Google тематический линк представляет большее значение. Значит составляем список тематических кеев для нашей странички/сайта. Быстро это можно сделать с помощью Google Keyword Tool Натравите его на вашу страничку и скачайте полученный *.csv файл. Кстати, тем кто еще не знает про Google LSI, рекомендую прочитать полезный пост у Незамутненного.

4. Более качественную выдачу дают запросы с операторами inurl: и allinurl:. Используйте их комбинируя с советами из пунктов 1 и 2

5. Если есть оператор “+”, значит должен и быть оператор “-”, который исключает страницы с какими-то словами. Например:

“Powered by phpBB” -viagra
“Powered by phpBB” -xanax
“Powered by phpBB” -porno
“Powered by phpBB” -sex

Кстати, если вы тупо спамите по buy viagra cheap viagra, то базу такими запросами не собирайте, а то все заспамленные страницы пройдут мимо

6. Не стесняйтесь собирать домены с дефисом. для этого пользуйтесь таким запросом

“Powered by phpBB” site:com -site:*com
“Powered by phpBB” site:net -site:*net
и т.д.

7. Если нам надо собрать странички с одного сайта то можно поступить следующим образом:

Допустим у нас есть запрос: money site:digg.com.

Расширить его можно таким образом money site:www.digg.com и money inurl:digg.com, только во втором случае результаты могуть быть урезаны, поэтому не забывайте, что за отображения полного SERP-a отвечает параметр &filter=0

Как видите, собрав небольшой список уникальных признаков разных движков, и комбинируя поисковые запросы можно собрать приличную базу. Экспериментируйте!



Пост написан красиво?
Стимулируй блога прогресс:
Не стоит покупать мне пиво,
Подпишись на RSS!   

Profile

SEO Critic
[info]seocritic
seocritic

Latest Month

November 2007
S M T W T F S
    123
45678910
11121314151617
18192021222324
252627282930 
Powered by LiveJournal.com
Designed by Tiffany Chow