Индексация форума Гуглом

Автор Солярис, 27 ноября 2009, 20:07:24

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Солярис

Всем доброго времени суток!

Интересует следующий момент. Гугл как-то странно индексирует страницы форума.
Адреса индексированных страниц получаются следующего вида (цифровые значения взяты условные): http://www.сайт.ru/index.php?topic=4444.msg11111

Интересует вот этот аппендикс ".msg11111".
Почему страница сохраняется именно с подобным адресом, который изначально не генерируется движком форума?
Во-первых, не понятно откуда Гугл вообще взял адрес с окончанием ".msg11111", когда индексируемая тема имеет адрес с окончанием ".msg11222".
Во-вторых, полный адрес такой страницы должен быть следующий:  http://www.сайт.ru/index.php?topic=4444.msg11222#msg11222

Наконец, не понятно, почему не индексируется самый простой в этой цепочке адрес: http://www.сайт.ru/index.php?topic=4444.0

Заранее спасибо за высказанные мнения и ответы.

Yworld_garry

Если речь про сайт из профиля, то просто проверьте урлы в панели гугла.
В вашем роботс разрешены всевозможные дубли и откуда и что генерит боту, а точнее что он ухватил не посмотришь.
Не индексирует самый правильный вариант, по той же причине. Он уже ухватил какой-то текст из топика и остальное содержащие этот же тест, по его мнению дубли, он их выкидывает.

Солярис

Что Вы именуете дублями? 8)
Это адреса с msg?

Yworld_garry


Солярис

Если эти адреса якобы дубли, то каким образом поисковик будет индексировать последующие (после первого) сообщения в созданной теме?
Ведь по логике роботс.тхт, указав в нем запрет на индексирование адресов с msg, поисковик будет индексировать в теме только содержание первого сообщения.
Кроме того, не понятно в этом случае, как поисковик будет индексировать тему с содержанием в несколько страниц.

Yworld_garry

Вроде это мы уже обсуждали и в той теме даны все исчерпывающие ответы.
По вашей логике заходя на сайт бот видит заголовок первого попавшегося предложения и не сканит дальше.
Не видит ссылок на другие страницы, просто тупо уходит.
Попробуйте открыть страничку исходный код. И посмотрите, там нет ни чего мешающего сканить весь текст.

И напишу ещё раз. Посмотрите код ДЕФОЛЕНОГО форума. Там все эти дубли закрыты. Или это случайно разработчики зделаи.
И скажу по секрету, такие дубли закрыты по дефолту на всех скриптах форумов.

Солярис


genix

<капитан_очевидность_мод>
Ваше окончание msg - это ссылка на определенное сообщение в теме (от англ. "message").
</капитан_очевидность_мод>

Тема сама имеет соответствующий адрес без этого окончания, который ведет на первую страницу. Если страниц больше, там генерируется уже другой аппендикс
Почему нет в индексе ссылок с #msg - потому что решетка обозначает ссылку внутри документа.

Зарпет индексации для гугла страниц с содержанием в ссылке ".msg" возможно решит вашу проблему. Про то как это сделать - в соседней теме про роботс.

Почему гугл цепляет именно ссылки с месаджами - потому что на главной и в списке разделов чаще всего имеются "Последние сообщения в темах", которые как раз таки ведут не на просто тему, а на последнее сообщение. Можно попытаться на программном уровне для гостей вообще отключить такие ссылки, но не уверен в правильности этого действия.
- Все, что не убьет меня, сделает меня сильнее - (Ф.Ницше, Карандаш, Кани Вест)