Гугл выдает значительно больше страниц, чем есть на самом деле
Страницы: 1
Гугл выдает значительно больше страниц, чем есть на самом деле, Индексация гугл
Всем доброго дня. Прошу совета у опытных пользователей.

Есть сайт [url]http://open-prezi.ru[/url]  Создан на движке Wordpress. На данный момент на сайте 165 страниц и 6 записей. В sitemap 171 url. По запросу в гугле site:open-prezi.ru находит 661 результат. Панель вебмастера гугл в разделе "Статус индексирования" показывает следующую информацию: Проиндексировано всего 658, просканировано за все время 755, заблокировано в файле robots.txt 219, удалено 365. Мне непонятно,подскажите пожалуйста, откуда эти 658 стр. ? Причем 25 августа было проиндексировано 209 страниц, 1 сентября уже 653, 8 сентября 658. 1 сентября было произведено обновление до версии Wordpress 3.6 - это могло как-то повлиять?

Немного опишу, какие действия производились с сайтом. Был установлен движок с файлом robots.txt, затем спустя время произведена настройка ЧПУ. Но гугл успел проиндексировать страницы без ЧПУ (судя по статистике панели вебмастер 25 августа), затем он также проиндексировал новые урлы. Кстати, страницы без ЧПУ с параметром "?" были запрещены к индексации в robots.txt, но все равно оказались проиндексированы и отображались в выдаче гугла правда с описанием "Описание веб-страницы недоступно из-за ограничений в файле robots.txt" Старые урлы с "page_id" (гугл выдавал примерно 130) также висели в поиске, но при клике по ссылке переход осуществлялся на новый адрес с ЧПУ. Также потом обнаружила, что в поиске выдается много страниц с параметром "feed" (около 150) в url, которые также были запрещены в robots.txt. Эти страницы опять же отображались в поиске с пометкой "Описание веб-страницы недоступно из-за ограничений в файле robots.txt"

Прочитав множество статей в интернете, поудаляла страницы c page_id, feed из результатов поиска через панель вебмастера. Количество страниц в выдаче по запросу site:open-prezi.ru в какой-то момент уменьшилось до 470 (с 680). Но сейчас снова выдает за 6 сотен - 661. При этом массово страниц с page_id и feed я не нахожу, гугл выдает результатов по 7.

Вот скрин раздела Параметры URL в панели вебмастера. [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112037.png[/url]
Здесь он показывет, что отслеживает аж 347 урлов с параметром page_id, 159 урлов с параметром feed...
Скрин статистики индексирования [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112824.png[/url]
[url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112928.png[/url]

Подскажите пожалуйста что-нибудь, как все это исправить. Не очень приятно видеть в панели cy-pr видеть такое [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09113118.png[/url] Получается что гугл видит на сайте множество дублей? Кстати, панель RDS показывает следующее [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09113211.png[/url]

И еще я абсолютно не понимаю арифметику гугла smile:confused: Сейчас страниц в выдаче по запросу site:open-prezi.ru - 661. Это как-то вяжется с общим кол-вом проиндексированных урлов в панели вебмастера - 658. Но панель веб-мастера ведь показывает, что удалено 365. Значит должно быть 658-365=293 ?
Изменено: Анастасия Владыкина - 9 Сентября 2013 12:06
у гугла несколько сайтов, отсюда и разница между рдс и супром

WMT - статистика, всегда была немного корявая (здесь она немного запаздывает)

От себя скажу - по поводу дублей, если сайт активно наполняется то такой маленький процент это норма, гугл сначала индексирует потом только думает, что оставить а что нет  ))  особенно на молодых сайтах и сайтах где была переделана структура, со временем все станет на свои места
open-prezi.ru/?page_id=796

open-prezi.ru/?page_id=976

и прочее удаляйте в панели вебмастера

Насчет страниц в гугле всегда их больше чем в яндексе, если на сайт не накладывались фильтры (по крайней мере ещё не 1 чтобы было наоборот не встречал)
Вот как нужно делать сайты Bezlimi.com
Я Джин пишет:
Цитата
со временем все станет на свои места
Спасибо за ответ. Т.е. со временем гугл выкинет лишние урлы?
Цитата
DmitryBezlimit пишет:
и прочее удаляйте в панели вебмастера
Да, конечно, сейчас подчищу все

Если еще у кого есть советы, пожалуйста пишите, всему рада smile:)
Цитата
Анастасия Владыкина пишет:
Если еще у кого есть советы, пожалуйста пишите, всему рада
Гугл очень неспешно удаляет дубли (иногда несколько раз приходилось удалять один и тот же урл. А вообще нужно смотреть, какой тип дублей у Вас основной, под него и запрет писать. Ещё бывает, что слишком большой robots Гугл не воспринимает как обязательный к исполнению.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
06:05 Стоит ли добавлять сайт в Rambler топ 100? 
20:17 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 
15:01 Adtrafico - Правильная партнёрская сеть под бурж трафик 
18:41 Продвижение заграницей 
16:34 Работает ли ссылочное продвижение 2019 – 2020? 
16:22 Adsense личный опыт 
16:20 АП Яндекс ИКС 16.11.2023 
04:29 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
02:34 Swap-line.com – это сервис быстрого обмена криптовалют на различные цифровые активы, а также на наличные средства во многих городах Украины! 
20:52 TrueMeds - Революционная Фарма Партнерка! Увеличь свой профит в x2 раза вместе с нами! 
20:01 Продам аккаунты 1 ТБ Облако@Mail.ru 
16:45 BIGPROXY.SHOP - Резидентные Ротационные Backconnect Proxy USA EUROPA MIX [Безлимитный трафик] 
14:10 Обменный пункт cashalot.one. Выгодный обмен. 
13:52 Мытнинский - безопасный обмен криптовалют с 2018 года 
23:18 Точные прогнозы на футбол 
22:39 Кому выплата РСЯ пришла и какого числа? 
12:12 Linux - это максимальная свобода 
20:09 Сколько сейчас стоит наполнение ИМ? 
12:43 Куплю проигрышные букмекерские аккаунты 
04:33 Половина скидок на распродажах — фейк 
07:53 НейроБабушка наказывает мошенников