Earth-prints repository, logo   DSpace

About DSpace Software
|earth-prints home page | roma library | bologna library | catania library | milano library | napoli library | palermo library
Please use this identifier to cite or link to this item: http://hdl.handle.net/2122/7425

Authors: Cassisi, C.*
Montalto, P.*
Pulvirenti, A.*
Aliotta, M.*
Cannata, A.*
Title: PYDBSCAN UN SOFTWARE PER IL CLUSTERING DI DATI
Title of journal: Rapporti tecnici
Series/Report no.: 182/ (2011)
Publisher: INGV
Issue Date: 2011
Keywords: clustering
Abstract: Con il termine clustering si indica il processo mediante il quale è possibile raggruppare oggetti in base a caratteristiche comuni (features). Questo approccio, alla base dei processi di estrazione di conoscenza da insiemi di dati (data mining), riveste notevole importanza nelle tecniche di analisi. Come verrà mostrato in questo lavoro, l’applicazione delle tecniche di clustering consente di analizzare dataset, con l’obiettivo di ricercare strutture che possano fornire informazioni utili circa i dati oggetto dello studio. Gli ambiti in cui tali algoritmi sono impiegati risultano essere eterogenei, a partire dalle analisi di dati biomedici, astrofisici, biologici, fino ad arrivare a quelli geofisici. La letteratura è ricca di vari casi di studio, dai quali il ricercatore può trarre spunto e adattare i differenti approcci alle proprie esigenze. Il software PyDBSCAN, oggetto del presente lavoro, permette di applicare tecniche di clustering basate sul concetto di densità, applicate ad oggetti (o punti) appartenenti ad insiemi definiti in uno spazio metrico. L’algoritmo di base è il DBSCAN (Density Based Spatial Clustering on Application with Noise) [Ester et al., 1996], di cui viene riportata una implementazione ottimizzata al fine di migliorare la qualità del processamento dei dati. Schematicamente, il sistema proposto può essere rappresentato come in Fig. 1. Il software, sviluppato in Python 2.6 [Python ref.], utilizza le librerie scientifiche Numpy [Numpy ref.], Matplotlib [matplotlib ref.] e la libreria grafica PyQt [PyQt ref.] impiegata nella realizzazione dell’interfaccia utente. Python è un linguaggio di programmazione che permette la realizzazione di applicazioni crossplatform in grado di funzionare su diversi sistemi operativi quali Windows, Unix, Linux e Mac OS. Nella prima parte del lavoro verranno brevemente descritte le tecniche oggetto del software presentato, mentre nella seconda parte verrà descritto un esempio di applicazione su dati reali.
Appears in Collections:05.01.05. Algorithms and implementation
Papers Published / Papers in press

Files in This Item:

File SizeFormatVisibility
Cassisi et al rapporto182.pdf1.09 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License
Creative Commons


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.


Share this record
Del.icio.us

Citeulike

Connotea

Facebook

Stumble it!

reddit


 

Valid XHTML 1.0! ICT Support, development & maintenance are provided by CINECA. Powered on DSpace Software. CINECA