HC-ONLINE/CiberWebScan_DEPRECATED
Herramienta híbrida para el reconocimiento pasivo y el análisis de superficie de ataque en aplicaciones web. Combina scraping avanzado, fingerprinting tecnológico, evaluación de seguridad y reporting en una sola solución CLI. Diseñada para un uso ético, educativo y de auditoría. Este software NO debe utilizarse en sistemas ajenos.
CiberWebScan
CiberWebScan es una solución integral diseñada para el reconocimiento pasivo y el análisis de superficie de ataque en aplicaciones web. Integra un potente motor de web scraping para la extracción de datos estructurados con funcionalidades avanzadas de fingerprinting tecnológico, evaluación de encabezados de seguridad, análisis de dependencias y cálculo de un score de exposición, ofreciendo una visión profunda y accionable de la postura de seguridad de un sitio web.
Desarrollada con fines educativos, de investigación y auditoría ética, CiberWebScan es ideal para profesionales de ciberseguridad, pentesting, análisis defensivo y la investigación de amenazas web.
Este proyecto fue descontinuado por problemas estructurales
de arquitectura, rendimiento y mantenibilidad.
Índice
- Aviso Legal y Ético
- Enfoque de Ciberseguridad
- Funcionalidades Clave
- Tecnologías utilizadas
- Estructura del proyecto
- Cómo empezar
- Uso
- Exportación y procesamiento de resultados
- Automatización
- Ejemplos
- Testing
- Solución de problemas
- Centralización de Configuración
- Licencia
Nota: El resto de este documento incluye avisos legales, éticos y detalles técnicos. Consulta la sección siguiente para información sobre uso responsable.
Aviso Legal y Ético
Esta herramienta ha sido desarrollada con fines educativos, de investigación, auditoría ética y análisis técnico de seguridad.
Su uso debe respetar siempre la legislación vigente, los términos de servicio de los sitios web objetivo y los principios de uso responsable.
Está estrictamente prohibido utilizar este software para acceder, recopilar o manipular datos de sitios sin autorización legal o contractual previa.
El autor, HC-ONLINE, no se responsabiliza por cualquier uso indebido, ilícito o no autorizado que terceros hagan de este software.
Enfoque de Ciberseguridad
Este proyecto va más allá de un simple scraper, evolucionando hacia una herramienta modular y extensible para el reconocimiento pasivo, fingerprinting tecnológico y análisis superficial de aplicaciones web, apoyando procesos de pentesting, análisis defensivo e investigación de amenazas web. Para una descripción detallada de su arquitectura y visión, consulta ARQUITECTURA.md.
Recomendaciones de uso responsable
- Asegúrate de contar con permiso explícito del propietario del sitio antes de ejecutar cualquier operación de scraping.
- Consulta los archivos
robots.txtde los sitios objetivo y respétalos. - Evita realizar solicitudes masivas o automatizadas que puedan afectar el rendimiento de servicios ajenos.
- Usa esta herramienta solo en entornos controlados, pruebas internas o dominios propios/autorizados.
Funcionalidades Clave
CiberWebScan ofrece un conjunto robusto de funcionalidades para scraping, análisis de seguridad y automatización. Entre sus capacidades principales se incluyen:
- Scraping tradicional y dinámico (Selenium)
- Exportación CSV/JSON
- Fingerprinting tecnológico
- Análisis de cabeceras HTTP y políticas de seguridad
- Consulta y enriquecimiento de CVEs
- Simulación de ataques ligeros (enumeración de directorios y pruebas XSS básicas)
- Gestión de sesiones, User-Agent y proxies
- CLI modular y automatización
- Suite de pruebas y métricas de rendimiento
Advertencia legal/ética: La funcionalidad de simulación de ataques ligeros está destinada únicamente a entornos controlados y pruebas autorizadas. El uso indebido puede ser ilegal y está estrictamente prohibido.
Para una lista completa y detallada de las características y su estado actual, consulta FEATURES.md.
Tecnologías utilizadas
- Python 3.12.5
- Flask
- HTTPX
- BeautifulSoup
- Selenium
- Bootstrap 5
Estructura del proyecto
Para una visión detallada de la estructura de directorios y la organización del código, consulta ARQUITECTURA.md.
Cómo empezar
Instalación Recomendada (Paquete Python)
El método recomendado para instalar CiberWebScan es como un paquete Python, lo que te permite usar el comando ciberwebscan desde cualquier ubicación en tu terminal.
Instalación en un solo paso (recomendado)
# Ejecuta el script de instalación automática
python install.py
# Verifica la instalación
ciberwebscan --helpInstalación manual alternativa
# Instalar en modo desarrollo (desde el directorio raíz del proyecto)
pip install -e .
# Verificar instalación
ciberwebscan --helpPara una guía detallada de instalación, consulta INSTALACION.md.
Método Alternativo: Instalación Tradicional
Si prefieres no instalar CiberWebScan como un paquete del sistema, puedes seguir el método de instalación tradicional. Sin embargo, ten en cuenta que este método puede requerir pasos adicionales de configuración y no incluirá el comando global ciberwebscan.
Uso {#uso}
Interfaz Web {#interfaz-web}
Para uso interactivo, ejecuta la aplicación web:
python app.pyLuego abre tu navegador en http://localhost:5000
Línea de Comandos (CLI)
Para automatización y uso desde terminal, puedes usar el comando global ciberwebscan (si lo instalaste como paquete) o python cli.py.
# Scraping básico
ciberwebscan scrape --url "https://quotes.toscrape.com/" --selector ".quote"
# Análisis de seguridad SSL/TLS
ciberwebscan analyze --url "https://example.com" --analyze-ssl
# Modo verbose para información detallada de depuración
ciberwebscan --verbose scrape --url "https://example.com" --selector ".quote"Para más ejemplos y un uso detallado de la CLI, consulta CLI.md. Para una referencia técnica completa de cada comando y sus argumentos, consulta cli/README.md.
Exportación y procesamiento de resultados
Metadatos en la exportación
Los archivos exportados incluyen metadatos detallados sobre el scraping, análisis de seguridad, logs de sesión y métricas de rendimiento. Para una descripción completa de los metadatos y ejemplos de exportación, consulta EXPORT_DETAILS.md.
Formatos de exportación
Los resultados del scraping pueden exportarse a CSV o JSON. El sistema gestiona la limpieza automática y diferida de los archivos exportados. Para más detalles sobre la exportación, limpieza y paginación, consulta EXPORT_DETAILS.md.
Notas sobre la sesión
La exportación solo funciona si hay datos en la sesión (es decir, si has realizado un scraping previamente en la misma sesión del navegador). Si abres una nueva pestaña o ventana, asegúrate de realizar un scraping antes de intentar exportar.
Automatización
El proyecto incluye scripts de automatización para ejecutar scraping periódico sin intervención manual. Para más información sobre automatización, consulta automation/README.md.
Ejemplos
El proyecto incluye una carpeta examples/ con scripts educativos que demuestran diferentes funcionalidades. Para más información sobre los ejemplos disponibles y cómo ejecutarlos, consulta examples/README.md.
Testing
El proyecto cuenta con una suite completa de tests. Para más información sobre cómo ejecutar los tests y la cobertura, consulta TESTS.md.
Solución de problemas
Para problemas comunes y sus soluciones, consulta ERRORES_COMUNES.md.
Centralización de Configuración
Todos los parámetros críticos y opciones globales del scraper están centralizados en config/config.py. Para más detalles sobre cómo personalizar el comportamiento del sistema, consulta CONFIGURATION.md.
Licencia
Este proyecto está licenciado bajo la Licencia Apache 2.0. Para más detalles, consulta el archivo LICENSE en la raíz del repositorio.
Hecho con ❤️ por HC-ONLINE
⭐ Si te resulta útil, deja una estrella en GitHub ⭐