Direct naar content

Databasebeheer anno nu. Een huwelijk tussen mens en AI?

Populaire clouddatabaseaanbieders (DBaaS en PaaS) hebben steeds vaker diensten als automatische indexing en query-optimalisatie geintegreerd in hun aanbod. Daarnaast komen er steeds meer AI-gedreven tools beschikbaar. Automatische indexing en query-optimalisatie met behulp van AI is absoluut mogelijk en wordt steeds geavanceerder, maar zonder menselijk toezicht of enig maatwerk, daar geloven we niet zo in. Zoals in zoveel vakgebieden is AI eerder een waardevolle, aanvullende tool. Het kan databasebeheerders helpen bij het efficiënter identificeren, aanmaken én beheren van indexen. In deze blog deelt Edco Wallet, mede-oprichter van OptimaData, enkele overwegingen met je.

Edco Wallet

Co-Founder & eigenaar
Edco Wallet - Co-Founder & eigenaar

Query-optimalisatie

Query-optimalisatie met behulp van AI richt zich op het verbeteren van de prestaties van databasequery’s door automatisch de meest efficiënte uitvoeringsplannen voor te stellen. Enkele manieren waarop AI een rol kan spelen bij query-optimalisatie:

  • Query-plan-analyse
  • Workloadprofiling
  • Kostenmodellering
  • Adaptieve query-optimalisatie
  • Parallelle query-processing
  • Automatische statistiekenverzameling
  • Indexadvies

Indexadvies

In deze blog ga ik wat dieper in op indexering. Voor alle eerdergenoemde toepassingen geldt dat menselijke expertise en monitoring noodzakelijk zijn om te zorgen dat de geautomatiseerde optimalisaties effectief blijven in verschillende situaties, dus ook voor het indexadvies. Dat neemt niet weg dat AI een waardevol hulpmiddel zijn bij geautomatiseerde indexing, bijvoorbeeld voor de volgende zaken:

1 Patroonherkenning

Machine-learning-algoritmen kunnen patronen in query’s en het gebruik van data herkennen. Op basis van deze patronen kunnen ze suggesties doen, zoals welke velden geïndexeerd kunnen worden om de query-prestaties te verbeteren.

2 Workloadanalyse

AI kan de workload van de database analyseren en het kan identificeren welke queries het meest worden uitgevoerd. Op basis van deze analyse kan het suggesties doen voor het creëren van indexen die de prestaties van veelgebruikte query’s optimaliseren.

3 Kosten-batenanalyse

Automatische indexing met AI kan rekening houden met de kosten en baten van het aanmaken van indexen. Het kan bepalen welke indexen waarschijnlijk de grootste prestatiewinst opleveren in vergelijking met de overheadkosten van het bijwerken en onderhouden van die indexen.

4 Adaptieve aanpassing

Sommige systemen gebruiken adaptieve indexering, waarbij je met AI de database voortdurend kunt monitoren en de indexen dynamisch laten aanpassen op basis van veranderende workloads en gebruikspatronen.

Beperkingen en overwegingen

Dit zijn natuurlijk allemaal prachtige mogelijkheden, maar ik zie ook enkele beperkingen:

1 Complexiteit van Workloads

Automatische indexing met AI kan minder effectief zijn in situaties met complexe query’s of workloads. Dan is er toch echt menselijke expertise nodig om de optimale indexen te bepalen.

2 Specifieke vereisten

Sommige databases hebben specifieke vereisten of optimalisaties voor automatische indexing die AI niet altijd volledig begrijpt. Ook hier is menselijke interventie nodig.

3 Monitoring en evaluatie

Als je automatische indexing met AI inzet, is het belangrijk om de voorgestelde indexen regelmatig te monitoren en te evalueren om ervoor te zorgen dat ze nog steeds relevant en effectief zijn. In feite zou je kunnen zeggen dat AI rekent met datgene wat voorhanden is en geeft daarvan de beste richting. Bij menselijk handelen door een expert wordt er niet alleen gekeken naar wat er nu is en wat er voorhanden is, maar ook naar de gewenste situatie en hoe je daar het best naartoe werkt. AI kan in dat proces wel helpen door snel inzichtelijk te maken welke opties er nu zijn op basis van de huidige set-up.

Wat zijn de risico’s van de inzet van AI in databasebeheer?

Naast de genoemde beperkingen, zijn er ook een aantal echte risico’s.

1 Onjuiste beslissingen

AI-modellen zijn zo goed als de gegevens waarmee ze zijn getraind. Als de trainingsgegevens biased, onvolledig of onjuist zijn, kunnen AI-modellen onnauwkeurige aanbevelingen doen of onjuiste beslissingen nemen. Er zijn nu eenmaal veel databaseomgevingen die lastig voorspelbaar zijn. We zien vaker bij analyses dat gedrag van drie maanden terug nu niet meer echt relevant is, omdat bijvoorbeeld de code is veranderd is of het eind van het jaar nadert en de eindejaarscijfers moeten worden opgehaald. Zo kent iedere periode trends in de databases. Als AI hierop dus te kort door de bocht acteert, is het risico groot dat je achter de feiten aanloopt.

2 Onvoldoende transparantie

Sommige AI-modellen, met name diepgaande neurale netwerken, kunnen als black boxes worden beschouwd. Dat betekent dat het moeilijk kan zijn om de exacte redenering achter een beslissing te begrijpen. Dit gebrek aan transparantie kan leiden tot moeilijk te verklaren beslissingen en daarmee tot wantrouwen.

3 Overfitting

Overfitting treedt op wanneer een AI-model te sterk wordt afgestemd op de trainingsgegevens en daardoor niet goed generaliseert naar nieuwe, niet eerder geziene gegevens. Dit kan leiden tot slechte prestaties op nieuwe query’s of workloads. Of op de lange duur “index everything”.

4 Verouderde modellen

Als AI-modellen niet regelmatig worden bijgewerkt met nieuwe gegevens, kunnen ze verouderd raken en minder effectief worden. Veranderende werklasten en gegevenspatronen moeten worden gevolgd en opgenomen in de modelupdates.

5 Onvoldoende beveiliging

Implementatie van AI in databases brengt nieuwe beveiligingsrisico’s met zich mee. Als de beveiligingsmaatregelen onvoldoende zijn, kunnen kwaadwillenden proberen het model te manipuleren of ongeautoriseerde toegang krijgen tot gevoelige informatie.

6 Privacykwesties

Het gebruik van AI in databases kan leiden tot privacykwesties, vooral als het model wordt getraind op gevoelige informatie. Het is belangrijk om ervoor te zorgen dat persoonlijke gegevens adequaat worden beschermd en dat het model voldoet aan de geldende wet- en regelgeving rondom privacy.

7 Onverwachte gedragspatronen

AI-modellen kunnen zich anders gaan gedragen dan verwacht, vooral in complexe en dynamische omgevingen. Onvoorziene interacties tussen verschillende delen van het systeem kunnen leiden tot onverwacht gedrag van de database.

8 Afhankelijkheid van datakwaliteit

AI-modellen zijn sterk afhankelijk van de kwaliteit van de gegevens die het krijgt. Als de gegevens van slechte kwaliteit zijn, kan dit leiden tot suboptimale prestaties en besluitvorming van het AI-systeem.

9 Gebrek aan menselijke expertise

Hoewel AI-systemen geavanceerd zijn, gaf ik eerder al aan dat menselijke expertise nog steeds onmisbaar is. Een gebrek aan betrokkenheid van databasebeheerders en andere experts kan leiden tot verkeerde interpretaties van resultaten en onvoldoende onderhoud van het systeem.

10 Gebrek aan compliancy

Het niet voldoen aan wet- en regelgeving met betrekking tot gegevensbeheer, privacy en beveiliging kan leiden tot juridische problemen en financiële sancties.

Balans is alles

Om deze risico’s te beperken, is het belangrijk om een evenwicht te vinden tussen de voordelen van AI en het beheersen van mogelijke uitdagingen. Dat doe je door middel van zorgvuldig ontwerp, een slim datamodel, goede monitoring, nauwkeurige evaluatie en optimale samenwerking tussen AI- en domeinexperts.

Wees realistisch

Over het algemeen is automatische indexing of query-optimalisatie met behulp van AI een waardevolle aanvulling op het takenpakket van databasebeheerders, maar het is belangrijk om realistische verwachtingen te hebben en de resultaten regelmatig te evalueren. Het kan niet volledig vervangen wat maatwerk en menselijke expertise kunnen bieden, zeker niet in complexe en unieke situaties.

Meer weten?

Wil je meer weten over de toepassing van AI in databasebeheer of heb je behoefte aan extra expertise bij het optimaliseren en indexering van je databases? Neem gerust eens vrijblijvend contact op, we helpen je graag.