kennismaking Joint Research Centre

  • warning: array_map() [function.array-map]: Argument #2 should be an array in /data/sites/web/datascapenl/www/modules/system/system.module on line 1015.
  • warning: array_keys() expects parameter 1 to be array, null given in /data/sites/web/datascapenl/www/includes/theme.inc on line 1817.
  • warning: Invalid argument supplied for foreach() in /data/sites/web/datascapenl/www/includes/theme.inc on line 1817.

Deze week een bezoek gebracht aan het Joint Research Centre van de Europese Commissie in Italië. Zij hebben een systeem ontwikkeld waarbij ze de online edities van alle kranten ter wereld iedere 10 minuten automatisch inlezen, doornemen en aan elkaar verbinden. Hier is bijvoorbeeld het laatste nieuws uit Nederland te vinden: http://press.jrc.it/NewsExplorer/home/nl/latest.html

Zij hebben dit ontwikkeld zodat de Europese Unie snel op de hoogte is van nieuws op een bepaald gebied en rond bepaalde personen, een soort knipselkrant dus. Het unieke is dat het nieuws geanalyseerd wordt ongeacht de taal. Ook zijn ze vrij ver met het semantisch web.

JRC liet me zien hoe ze vrij adequaat plaatsvarianten (Londen/London/Londres) en iemand als George Bush in verschillende talen herkend wordt. Nooit echt bij stil gestaan, maar kranten schrijven namen van bekende personen per taalgebied anders (Hussain/Hussein/Hüseyin) en sommige taalgebieden kennen bijvoorbeeld naamvallen voor namen.

Daarnaast analyseren ze het nieuws op conflicten en rampen met als idee snel onrust in de Europese Unie te kunnen opsporen. Ze maken dan ook gebruik van technieken die ook bij de Europese inlichtingendiensten gebruikt worden om data te analyseren.

Citaten

Interessant is dat ze uit de artikelen ook citaten destilleren van personen. Bij iedere persoon staat welke uitspraken diegene in een krant heeft gedaan. De data wordt ook gebruikt om te analyseren hoe iemand zich tot een ander verhoudt.