Els llacs de dades, una oportunitat per a les pimes

Un 64% d’empreses a Espanya, la majoria grans, recorren a repositoris d’informació per a la seva gestió / La implantació en petits i mitjans negocis és l’assignatura pendent

Els llacs de dades, una oportunitat per a les pimes
4
Es llegeix en minuts
Carles Planas Bou
Carles Planas Bou

Periodista

Especialista en tecnologia i el seu impacte sociopolític.

Ubicada/t a Barcelona

ver +

Les dades mai dormen. Actualment, internet té uns 5.450 milions d’habitants, més del 67% de la població mundial. La seva activitat en la web, incessant com un torrent desbordat, deixa un rastre d’informació que s’emmagatzema en arxius digitals. El seu volum és tan ingent que és pràcticament impossible d’imaginar. No obstant, aquest vast oceà de dades pot ser crucial per a les empreses, si saben navegar-lo.

Per treure’n profit, cada vegada més companyies aposten pels data lakes o llacs de dades, una eina que permet emmagatzemar qualsevol tipus d’informació. A diferència de les bases de dades tradicionals, que les categoritzen segons el seu format, en aquests repositoris conviuen sense processar arxius d’Excel, correus electrònics, imatges, àudios, vídeos i fins i tot llenguatge HTML, crucial per a la creació de pàgines web.

Anàlisi matemàtica i IA

Tenir totes les dades agrupades en un únic espai permet a les empreses poder visualitzar-los en un mapa i accedir-hi amb facilitat per analitzar-les amb matemàtica avançada i intel·ligència artificial (IA). Com es crivella la terra per trobar minerals, el filtratge és el que dota les dades de valor i en permet extreure el coneixement necessari per prendre millors decisions corporatives. Aquest procés permet ajudar els bancs a detectar oportunitats de negoci, als hospitals a millorar els seus diagnòstics clínics o als supermercats a manejar millor els seus inventaris. Així, la flexibilitat que proporcionen els data lakes es tradueix en més eficiència en la gestió empresarial.

Tot i que es tracta d’un terme tècnic poc conegut entre el gran públic, els llacs de dades tenen un pes creixent en el rumb de l’economia global. El 2023, el seu mercat es va valorar en 15.200 milions de dòlars (uns 13.610 milions d’euros), una xifra que, segons els càlculs de Global Market Insights, superarà els 80.000 milions de dòlars (uns 71.630 milions d’euros) el 2032.

Aquesta projecció de creixement, d’un 20% anual, es deu al fet que la digitalització mundial està accelerant amb particular èmfasi el volum de dades no estructurades, les que es generen diàriament en xarxes socials, plataformes digitals i tots els objectes connectats a la xarxa que porten l’smart com a prefix. Conscients que aquesta abundància d’informació es pot polir per transformar-se en intel·ligència, cada vegada més empreses aposten per una presa de decisions basada en l’analítica de dades. Els data lakes són l’instrument més eficient per sustentar aquest canvi en la cultura corporativa.

‘Data warehouses’

A diferència dels data lakes, els data warehouses són els repositoris que emmagatzemen només dades prèviament etiquetades i procedents d’aplicacions, negocis, inventaris o transaccions. "Els data lakes són normalment utilitzats per científics i enginyers de dades per realitzar anàlisis complexes. Els data warehouses, en general, són usats per analistes de negoci per generar informes específics", explica Carlos Martínez, director global de Solucions i Serveis d’Intel·ligència Artificial i Data de Telefónica Tech.

La datificació del teixit empresarial va a més. A Espanya, un 64% de les companyies ja recorren als llacs de dades per depurar grans volums de dades i convertir-les en valor per a l’organització, segons l’últim informe de la plataforma de gestió de dades Denodo. Aquesta implantació és particularment alta en les grans empreses que fa anys que inverteixen en la seva transformació en negocis impulsats per les dades o data-driven.

No obstant, per a les petites i mitjanes empreses, els data lakes són encara una assignatura pendent. "Les pimes estan una mica per darrere, però l’impuls a la digitalització dels fons europeus les està ajudant a començar el seu procés", assenyala Martínez. Una opció és Kit Consultoria, un programa d’ajudes impulsat pel Govern d’Espanya que permet finançar la digitalització de totes aquestes companyies mitjançant l’assessorament de serveis de consultoria. A més, afegeix l’expert, "les activitats més tècniques poden ser externalitzades a proveïdors especialitzats, fet que simplifica les coses per a les empreses".

Principals proveïdors

Amazon, Microsoft i Google són els grans proveïdors d’infraestructura al núvol, cosa que els dona una posició d’avantatge en el mercat dels data lakes. Tot i així, hi ha altres companyies que ofereixen aquesta eina de gestió de dades: Oracle, Teradata, Snowflake, IBM, Cloudera...

A escala global, el sector en el qual més s’aplica aquesta eina és el de la sanitat i les ciències de la vida, segons indica un estudi recent de la firma Market Research Future. Això es deu a la creixent digitalització d’hospitals i clíniques, un procés que va des de l’adopció de registres mèdics electrònics fins a la telemedicina o l’ús de tecnologies d’IA per a l’avaluació mèdica. Sense una gestió segura i àgil de les dades generades pels pacients i les recerques, aquestes innovacions no són possibles. En aquesta línia, l’Executiu espanyol ha destinat 28milions d’euros a crear el seu data lake sanitari, un repositori nacional que uneixi la informació dels sistemes autonòmics per identificar malalties que abans passaven desapercebudes i millorar-ne els tractaments.

Notícies relacionades

La inversió pública en els llacs de dades, explica Martínez, també es destina a àmbits que es poden nodrir de la datificació, com l’agricultura i la gestió mediambiental. No obstant, l’altre sector amb més protagonisme en aquest camp és el de la banca, els serveis financers i assegurances, una indústria que se serveix de les dades per analitzar riscos en els préstecs i inversions, detectar transaccions fraudulentes i personalitzar els seus productes.

D’altres sectors que recorren als data lakes són el tecnològic i el de les telecomunicacions (per exemple, per optimitzar el rendiment de la xarxa o desenvolupar nous productes partint del comportament dels usuaris), el comerç minorista i electrònic (per analitzar els patrons de compra dels clients) i la manufactura (per fer que el procés de producció sigui més eficient).