Saltar al contenido
Lección 5 de 8

Búsqueda Avanzada y Google Dorking

4 min read

El Poder de la Búsqueda Avanzada

Los motores de búsqueda son, probablemente, la herramienta de OSINT más subestimada. La mayoría de la gente solo escribe palabras sueltas, pero los buscadores ofrecen un lenguaje de operadores que convierte una búsqueda genérica en una consulta quirúrgica. Dominar estos operadores permite encontrar exactamente lo que se busca y descartar el ruido, multiplicando la eficacia del investigador.

El conjunto de técnicas que combina estos operadores para descubrir información específica se conoce como Google Dorking (o Google Hacking, término acuñado por Johnny Long). A pesar del nombre, la técnica es aplicable a casi cualquier motor — Bing, DuckDuckGo o Yandex tienen sus propios operadores. La idea central es la misma: instruir al buscador para que devuelva solo páginas que cumplan condiciones muy precisas.

Es fundamental entender que el Google Dorking no accede a nada que no esté ya indexado y públicamente accesible. Encuentra lo que está expuesto, no lo que está protegido. Por eso es una herramienta tan valiosa para las auditorías defensivas: revela qué información sensible de una organización ha quedado, sin querer, al alcance de cualquier buscador.

Operadores Fundamentales

Algunos operadores forman la base de todo dorking. site: limita los resultados a un dominio concreto: site:ejemplo.com muestra solo páginas de ese sitio, ideal para mapear todo lo indexado de un objetivo. filetype: (o ext:) busca tipos de archivo específicos: filetype:pdf o filetype:xlsx ayudan a encontrar documentos que a menudo contienen información interna y metadatos.

Los operadores intitle: e inurl: buscan términos en el título de la página o en la URL respectivamente, muy útiles para localizar paneles de administración o páginas concretas (intitle:"index of" revela listados de directorios abiertos). Las comillas fuerzan una coincidencia exacta de frase, el guion - excluye términos, y el operador OR (en mayúsculas) amplía la búsqueda a alternativas.

La verdadera potencia aparece al combinarlos. Una consulta como site:ejemplo.com filetype:pdf "confidencial" busca documentos PDF marcados como confidenciales en un dominio específico. En una auditoría, este tipo de consulta puede revelar fugas reales: documentos internos, copias de seguridad expuestas o credenciales en archivos de configuración indexados por error.

Dorking Responsable y la Google Hacking Database

Existe un repositorio público, la Google Hacking Database (GHDB) mantenida por Exploit-DB, que cataloga miles de dorks conocidos: consultas que revelan archivos de configuración expuestos, cámaras accesibles, mensajes de error reveladores o credenciales filtradas. Es un recurso de aprendizaje excelente para entender qué tipos de exposición existen y cómo formular consultas eficaces.

El uso responsable de estos dorks es clave. Buscar información expuesta de tu propia organización, o de un objetivo dentro del alcance de un pentest autorizado, es OSINT legítimo y muy útil. Sin embargo, usar la información encontrada — por ejemplo, credenciales filtradas o paneles expuestos — para acceder a sistemas ajenos sin permiso es ilegal, independientemente de lo fácil que haya sido encontrarla.

El dorking es, en este sentido, una herramienta de doble filo que el investigador ético usa principalmente para defender. Encontrar que un documento sensible está indexado permite solicitar su retirada; descubrir un panel expuesto permite cerrarlo antes de que lo encuentre un atacante. El valor está en la prevención, no en la explotación.

Motores y Fuentes Especializadas

Más allá de Google, existe un ecosistema de buscadores especializados que cubren nichos concretos. Ya mencionamos Shodan, Censys y crt.sh para infraestructura. Para personas y datos profesionales, plataformas como LinkedIn o buscadores de correos como Hunter.io aportan ángulos distintos. Para código fuente, GitHub y GitLab cuentan con sus propios buscadores, donde es habitual encontrar secretos filtrados accidentalmente en commits (claves de API, contraseñas en archivos de configuración).

Las máquinas del tiempo como Wayback Machine (archive.org) son indispensables: permiten ver versiones antiguas de una página web, recuperando contenido que el objetivo ya eliminó pero que sigue siendo de interés. Un correo de contacto, una estructura de directorios o un documento que ya no existe en el sitio actual a menudo siguen accesibles en el archivo histórico.

Finalmente, los metabuscadores y agregadores combinan múltiples fuentes en una sola consulta. La clave del éxito no está en conocer una única herramienta mágica, sino en saber qué buscador es el adecuado para cada tipo de dato y en combinar varios para corroborar los hallazgos. La búsqueda avanzada es la columna vertebral del OSINT: casi toda investigación empieza y vuelve, una y otra vez, a una caja de búsqueda bien utilizada.