| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Eines de captura

Page history last edited by mikifus 11 years, 3 months ago

Eines de captura

 

 

Són les que permeten cercar, copiar i exportar els tuits dels comptes dels usuaris. En destaquem les següents:

  • Twitter Api (application programming interface, interfície de programació d'aplicacions): eines creades per Twitter que permeten als programadors desenvolupar les pròpies aplicacions. La REST API permet publicar microentrades en les aplicacions, seguir algú o crear llistes. La Search API serveix per cercar tuits en un índex de tuits recents; no es poden recuperar tuits més enllà d'una setmana i només es recuperen els tuits considerats rellevants dins la cerca. Les Streaming API les utilitzen els desenvolupadors que volen tota la seqüència de tuits en temps real en el mateix moment en què es publiquen a Twitter. Trobem l'API per a la seqüència de tuits públics (public streams), per a la seqüència de tuits d'un compte d'un usuari (user streams) i per a la seqüència de molts comptes de diferents usuaris (site streams). Aquesta última és una eina molt recent i, per això, no totes les aplicacions hi tenen accés. Les dues eines següents utilitzen el Twitter Api com a base:

    • TwapperKeeper: programa finançat pel JISC (Joint Information Systems Committee) del Regne Unit. Permet crear un arxiu de tuits en un servidor propi en quatre formats diferents: HTML, RSS, XLS i JSON.13

    • Backupify: permet exportar els continguts dels tuits en arxius PDF indexats o fitxers JSON. Arxiva fins a 1 GB de tuits en el núvol de manera gratuïta utilitzant la infraestructura Amazon S3 (simple storage service). En cas que se sobrepassi el gigabyte, el servei passa a ser de pagament. Seguint els límits que imposa Twitter Api, només permet capturar els 3.200 tuits més recents.

  • Archive-it: servei ofert per Internet Archive, entitat que treballa en la preservació web des de 1996. Archive-it és una aplicació web de pagament que permet crear, descarregar i gestionar col·leccions digitals amb diferents tipus de continguts i accedir-hi, com ara: HTML, vídeos o àudio.14 Cal destacar que pot capturar xarxes socials, entre les quals hi ha Twitter. Aquesta eina permet exportar la col·lecció i rebre'n una còpia dins un disc dur amb les dades capturades.

  • Heritrix: rastrejador web (crawler) gratuït i de codi obert que va crear Internet Archive amb la col·laboració del Nordic Web Archive el 2003 (Mohr et al., 2004) implementat en llenguatge JAVA. El format de captura és HTML, i el d'emmagatzemament de la informació és ARC. És l'eina que utilitza PADICAT.

  • Web Analyzer: aplicació que es pot integrar en un dels mòduls de Heritrix que permet identificar l'idioma de la pàgina web o filtrar-la per tema. Està desenvolupada per la Biblioteca de la República Txeca (Vlcek, 2008).

 


Aquesta informació ha estat extreta d'aquí: http://www.ub.edu/bid/29/locher1.htm

Comments (0)

You don't have permission to comment on this page.