En una anterior entrada hablaba sobre que se me estaba agotando el ancho de banda asignado para el dominio que aloja esta bitácora. No llegué a decirlo claramente, pero, sí que me parece que insinué que alguien estaba tratando de jorobarme, puesto que había notado de un tiempo a esta parte que ciertos archivos eran requeridos "demasiado", como si lo hicieran adrede, para "gastar" ancho de banda. Pues bien, las cosas como son: estaba equivocado, y parece que he encontrado una posible explicación a lo que realmente está ocurriendo.
Sé que a nadie le importará demasiado esto, pero, en fin, ahí va. Lo primero que me llamó la atención y así lo dije en la entrada que enlazo arriba, fue que este incremento en el consumo de ancho de banda se había producido desde junio para acá, más o menos, y no antes. Y también dije que lo que más se pedía eran ciertos archivos JavaScript, sobre todo. No me dí cuenta entonces de que dichos archivos JavaScript se habían comenzado a usar en esta bitácora, precisamente, por las fechas en que se comenzó a incrementar el ancho de banda consumido.
Así que ahí ya tenemos una primera aproximación a la realidad: ahora se piden ciertos archivos, que antes, simplemente, no estaban... y no se podían pedir, naturalmente. Pero, ¿quién demonios está solicitando dichos archivos cada dos por tres? Pues ni más ni menos que "Google Bot", el robot de Google que rastrea esta bitácora, como toda página web, buscando contenido para indexarlo en su buscador. Ahora bien, mi sorpresa ha sido (causada por mi ignorancia) cuando he podido relacionar al robot de Google con la petición de los archivos en cuestión, y es que las IPs no coinciden.
Efectivamente, cuando tú, por ejemplo, navegas por una página de esta bitácora, el servidor guarda en el archivo "log" correspondiente la petición HTTP que has necesitado hacer, y, los archivos que acompañan a esta petición, por decirlo así, tienen todos la misma IP, es decir, es tu IP la que aparece referida en relación a un determinado archivo necesario para tu petición. Pero, ay, amigo, resulta que esto no sucede así cuando quien hace una petición es el robot de Google (y en general otros robots, y más allá seguro que se me escapa algo). En este caso, la cosa cambia, y de ahí mi error.
Resulta que la petición sí aparece con la IP del robot de Google, pero, los archivos necesarios para dicha petición, no. ¿Y qué IP aparece para estos archivos? Como imaginarás, la IP del servidor, de ahí que yo pensara que "algo desde dentro" estaba intentando jorobarme... porque la IP que requería los archivos era la IP del servidor de esta propia bitácora. Por otro lado, parte del problema residía en... tengo que decirlo... Gesbit, el gestor de bitácoras que gestiona esta que lees ahora. Si lo nombro para lo bueno, no tengo por menos que nombrarlo también para lo malo. Y esta vez no toca otra cosa.
Por decirlo mal y pronto, para no alargar esta entrada demasiado, diré que Gesbit aceptaba ciertas peticiones un tanto "extrañas" por parte del robot de Google. Pero, complicaba todavía más el asunto, puesto que, no sólo servía el contenido al robot de Google cuando acaso no tendría que hacerlo, sino que, dicho contenido, incluían enlaces "recursivos", por decirlo así, enlaces que llevarían al robot de Google de nuevo al mismo sitio... donde se le ofrecerían nuevos enlaces, aparentemente, pero, que, también le llevarían al mismo lugar. He procurado esta noche solucionar este problema.
Al fin creo que he solucionado el asunto, aunque, no nos vamos a engañar, no me queda del todo claro. Al menos, creo que el problema se habrá reducido, cuando no solucionado, aunque, a decir verdad, pareciera que estoy culpando a Gesbit (y por tanto a mí mismo) del desaguisado, y, tampoco Gesbit tiene completamente la culpa. Es decir, en "imprimir" enlaces equivocados, sí, desde luego, y este punto he tratado de arreglarlo, como digo, y ahora mismo todas mis bitácoras están ya actualizadas en este sentido, pero, es que no es sólo este el problema, sino que no sé cómo actuar en determinados casos.
Resulta que, me ponga como me ponga, el robot de Google visita esta bitácora, y es bien que la visite, pero, cada una de sus peticiones lleva implícitos ciertos archivos, que, sinceramente, no sé hasta qué punto son necesarios, teniendo en cuenta que se trata de un robot... y no ve las cosas de la misma forma que las ve una persona. ¿Necesita el robot de Google contar con la biblioteca jQuery? ¿Hace falta servirle el correspondiente archivo JavaScript? Si determinamos que sí, poco se puede hacer... mientras el robot de Google insista en visitar esta bitácora.
En definitiva, creo que he conseguido arreglar el problema en Gesbit respecto de los enlaces "infinitos", o "recursivos", o como los queramos llamar. Y a partir de aquí habrá que esperar un poco a ver cómo evoluciona el asunto, puesto que es de suponer que Gesbit no confunda más al robot de Google, y, por tanto, en este sentido se acabó el problema. Supongo que no puedo hacer otra cosa que esperar a ver cómo transcurren los próximos días, vigilando los "logs" del servidor. Supongo que aburriré a más de uno, pero, tal vez esto no termine aquí, sino que todavía pueda añadir algo.