La minería de datos (o Data Mining) es un proceso de extracción de información y búsqueda de patrones de comportamiento que a simple vista se ocultan entre grandes cantidades de información.
Existen algunas herramientas diseñadas para extraer conocimientos desde bases de datos que contienen grandes cantidades de información. Las más populares de estas herramientas son SPSS Clementine, Oracle Data Miner y Weka. Esta última herramienta es la más asequible y popular ya que se desarrolla en Java y bajo licencia GPL.
Concretamente Weka permite cargar los datos para analizar desde una base de datos, un fichero .csv o ficheros .arff (el formato propio de Weka).
Supongamos que tenemos un conjunto de datos distribuidos en filas que se agrupan entre sí formando grupos a clusters. Una vez cargados los datos en Weka, podemos utilizar la herramienta para detectar cuáles son los datos más relevantes que permiten clasificar las datos en esos grupos.
Es más, podemos utilizar esos datos para crear árboles de decisión o reglas de clasificación que nos ayuden a entender por qué cada fila de datos cae en un determinado grupo.
También podemos utilizar esta herramienta de data mining para clasificar nuestros datos en grupos (clusters) utilizando algoritmos de clustering como por ejemplo k-means.
En definitiva, este tipo de herramientas harán las delicias de los fanáticos de las estadísticas ansiosos de exprimir los datos para obtener más información. Esto es sólo una pequeña parte de lo que permite Weka pero, si tenemos acceso a alguna de las otras herramientas de pago que mencionaba, quedaremos asombrados con la posibilidad de hacer aún muchas más cosas.
En este tipo de topología de red, todos los nodos de una red están conectados a un medio de transporte común que tiene dos puntos finales. Todos los datos que viajan a través de la red se transmite a través de un medio de transmisión comunmente conocido como Bus o columna vertebral de la red. Cuando el medio...
La primogénita y elemental contabilidad que mecanicé allá por el año 1983 la realicé en un primitivo ordenador mastodonte, donde había que meter grandes discos cada ciento y pico de apuntes y siempre con el alma en vilo por si se te iba la información (con qué cara le decía al jefe que había perdido todo...
El monitor es cada día tomado más en cuenta por las compañías fabricantes, por lo que han decidido darles un gran valor agregado a todas ellas, presentando agregados muy innovadores, capaces de convertirlos en verdaderas piezas de valor, las mismas que van a complementarse debidamente con el sistema que los...
Recientemente, la firma comScore (firma líder en estadisticas y medición del mundo digital) dio a conocer las 10 tendencias digitales que se mantendrán durante los próximos meses; el crecimiento de las redes sociales, el correo electrónico utilizado desde otras plataformas y dispositivos y el uso del video a...
En muchas empresas la compra de equipos informáticos se realiza pensando en un equipo multipropósito que en ocasiones ya viene corto de prestaciones cuando son nuevos. Tipos de topologias de red y equipos con Windows XP y 256 MB de RAM son habituales en muchas empresas. Esto, en mi opinión, es un error. Las...
Registro automático