A Web actual fornece uma infra-estrutura para trabalhar com documentos multimédia distribuídos, que são trocados usando o conhecido “http”, ou Protocolo de Transferência de Hipertexto. Mas embora uma enorme quantidade de dados esteja disponível online, eles são armazenados em tantos formatos diferentes que se tornou difícil, se não impossível, analisar e usar em pesquisas, diz Georg Reinhart, pesquisador visitante em matemática, estatística e ciência da computação na UIC.
“Os médicos, por exemplo, muitas vezes precisam compartilhar informações e dados, mas cada médico armazena e carrega os dados em seu próprio formato”, disse Reinhart. “Astrônomos, físicos e outros pesquisadores muitas vezes enfrentam o mesmo problema”.
De acordo com Reinhart, que desenvolveu o DSTP com Emory Creel, um colega do Centro Nacional de Mineração de Dados, o novo protocolo de transferência unificará a forma como os dados são armazenados online. O download de dados de diferentes sites através de redes de alta velocidade e a análise dos dados em tempo real se tornará possível pela primeira vez.
“DSTP irá padronizar a forma como os dados são compartilhados, da mesma forma que HTTP revolucionou a forma como os documentos são compartilhados”, disse Reinhart. “Os pesquisadores serão capazes de pesquisar, analisar e minerar bancos de dados simultaneamente, mesmo que os bancos de dados contenham diferentes tipos de dados”. Reinhart prevê que o DSTP motivará mais pesquisadores a publicar dados globalmente e levará a uma “avalanche” de dados novos e existentes, acessíveis e úteis para um público mais amplo”.
Six sites ao redor do mundo, incluindo o Reino Unido e Austrália, estão participando esta semana de uma demonstração de transferência de dados distribuídos usando DSTP no Workshop Gigabit Networking da NASA/NREN em Moffet Field, Califórnia.
DSTP está disponível gratuitamente para o público. O software, juntamente com uma demonstração de amostra, está disponível em http://www.dataspaceweb.net. O National Center for Data Mining também está empenhado em criar a infra-estrutura e software necessários para suportar o DSTP para mineração de dados distribuídos.
Com 25.000 estudantes, a Universidade de Illinois em Chicago é a maior e mais diversificada universidade da área de Chicago. A UIC abriga a maior faculdade de medicina dos Estados Unidos e é uma das únicas 88 universidades nacionais de Pesquisa I. Localizada a oeste do Loop de Chicago, a UIC é uma parte vital do tecido educacional, tecnológico e cultural da região. Para mais informações, visite www.uic.edu