<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
	<channel>
		<title>Info DataCosa è il progetto GovScape? #BuoneFeste2026 - Info Data</title>
		<link>https://www.infodata.ilsole24ore.com/2026/01/09/cosa-e-il-progetto-govscape/</link>
		<description>Le notizie raccontate con i  numeri</description>
		<lastBuildDate>Mon, 18 May 2026 11:34:02 +0000</lastBuildDate>

					<item>
				<title>Cosa è il progetto GovScape? #BuoneFeste2026</title>
				<link>https://www.infodata.ilsole24ore.com/2026/01/09/cosa-e-il-progetto-govscape/</link>
				<pubDate>Fri, 09 Jan 2026 17:15:59 +0000</pubDate>
				<dc:creator><![CDATA[Infodata]]></dc:creator>
								<source>Ecologia</source>
				<sourcelink>https://www.infodata.ilsole24ore.com/argomento/ecologia</sourcelink>
				
				<description>
					<![CDATA[<p data-start="310" data-end="1252">Negli archivi digitali dei governi i PDF non sono un residuo del passato: sono la forma con cui si materializza gran parte dell'informazione pubblica. Un progetto come<a href="https://arxiv.org/abs/2511.11010"> GovScape</a>, sviluppato da ricercatori della University of Washington e della Boston University, rappresenta un cambio di prospettiva. Gli autori hanno preso 10 milioni di documenti PDF provenienti dalla "End of Term Web Archive" del 2020 e li hanno trasformati in un corpus ricercabile, navigabile, interrogabile come se fosse un gigantesco database. È un’operazione che ricorda la bonifica di un territorio: il suolo è lì, vasto e ricco, ma finché non costruisci strade e...</p>]]>
				</description>

									<enclosure length="0" type="image/jpeg" url="https://www.infodata.ilsole24ore.com/wp-content/uploads/sites/89/2025/12/sqsqwswqd.jpg"/>
												<post-id xmlns="com-wordpress:feed-additions:1">93818</post-id>			</item>
			</channel>
</rss>