С 27 марта открыт новый форум. Текущий теперь является архивным. Возможности добавления топиков и ответов отсутствуют.
| NetCat Standard 2.3 - вылетают страницы из поисковика Яндекс | GRR 10.03.2006 21:13 |
Регулярно "исчезают" из поиска титульные страницы сайтов сделанных на NetCat 2.3. Причем с сайтами сделанными на Small Business 2.2 такого не случается. :-(
Все сайты (SB и Standard) расплоложены на одном сервере (PHP как cgi), поэтому настройки сервера не влияют.
Писал в сам Яндекс - вот что ответили:
"В базе нет главной страницы, она была удалена 28.02.06 23:07, потому что на ее запрос роботом отдавалась некорректная информация в http заголовке Content-Type: text/html. Почему так происходило, выясните, пожалуйста."
И так каждый раз - то есть страница в поиске, то нет. Что может быть с заголовками в разных версиях NetCat???
GRR 10.03.2006 21:39
Анализ заголовков на toolbar.ru выдал следующее:
NetCat 2.3:
Выводы
1). Присутствует идентификатор динамичности страницы "X-Powered-By".
2). Отсутствует кодировка документа.
HTTP заголовки
Cache-Control no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Client-Date Fri, 10 Mar 2006 18:33:33 GMT
Client-Transfer-Encoding chunked
Connection close
Content-Type text/html
Date Fri, 10 Mar 2006 18:33:33 GMT
Last-Modified Thu, 09 Mar 2006 18:33:33 GMT
Pragma no-cache
Server Apache/1.3.33 (Debian GNU/Linux) PHP/4.3.10-16 mod_ssl/2.8.22 OpenSSL/0.9.7e
X-Powered-By NetCat/2.3.236 (Standard)
NetCat Small Business:
Выводы
1). Присутствует идентификатор динамичности страницы "X-Powered-By".
2). Отсутствует дата изменения документа.
3). Отсутствует кодировка документа.
HTTP заголовки
Client-Date Fri, 10 Mar 2006 18:35:48 GMT
Client-Transfer-Encoding chunked
Connection close
Content-Type text/html
Date Fri, 10 Mar 2006 18:35:48 GMT
Pragma no-cache
Server Apache/1.3.33 (Debian GNU/Linux) PHP/4.3.10-16 mod_ssl/2.8.22 OpenSSL/0.9.7e
X-Powered-By PHP/4.3.10-16
Может быть всЈ из-за различий в X-Powered-By и даты изменения документа???
Помнится по опыту передавали в заголовке дату изменения и потом сайт тоже вылетал из поиска.
 |
MipH 10.03.2006 22:05
Я не очень понял из ответа Яндекса, в чем все же проблема...
GRR 10.03.2006 22:38
Проблема в том что с заголовками в NetCat 2.3 что-то не так и у сайтов на 2.3 регулярно (через 1-2 индексации) "морда" отваливается - поисковик его не видит.
Может там где то в 2.3 передается "дата изменения документа"?
GRR 11.03.2006 09:13
Сделали заголовки в 2.3 как на "старой" Small Business 2.2 - посмотрим при следующей индексации.
GRR 11.03.2006 11:48
В общем нужно в файле /netcat/require/e404.php
заслешировать (// добавить) следующее:
//header('Cache-Control...
//header('Cache-Control...
//header('Last-Modified...
и тогда Яндекс не будет "спотыкаться" о заголовки.
DiGGy 14.03.2006 18:39
вот тут, кстати, написано и о Last-Modified и о Content-Type http://yandex.ru/info/webmaster5.html
и еще в случае "PHP как cgi" рекомендую заремить следующее в файле e404.php:
switch ($PHP_TYPE) {
case "module": header("HTTP/1.1 200 OK"); break;
case "cgi": header("Status: 200 OK"); break;
}
потому как после выдачи заголовка header("Status: 200 OK") никакой заголовок установить не получается.. даже ошибку 404!
|