Stel je voor, je hebt een aantal PDFs waar je informatie uit wilt halen en in een tekstbestand zetten. Natuurlijk zijn er in tegenwoordig veel oplossingen die dit mogelijk maken zoals bijvoorbeeld Azure AI documentanalyse of Robotgestuurde procesautomatisering (RPA) oplossingen. Maar helaas heb je zelf niet altijd toegang tot dergelijke, vaak dure, tools. Gelukkig is er een applicatie waarmee je het ook eenvoudig zelf kunt doen: Power Automate Desktop!
In dit artikel gaan we laten zien hoe je een RPA oplossing kunt maken in Power Automate Desktop. De basis hiervoor vormt een set facturen (PDF) waarvan we de gegevens willen extraheren.
Wat is Robotgestuurde procesautomatisering?
Binnen organisatie waar veel processen worden ondersteunt door IT hoor je tegenwoordig steeds vaker de opmerking: ‘Misschien kunnen we dat oplossen met RPA’ voorbijkomen. Maar wat is het nou eigenlijk? RPA staat voor Robotgestuurde procesautomatisering en is een techniek die gebruikt wordt voor het automatiseren van bedrijfsprocessen. Dit automatiseren gebeurt door zogenaamde software robots via de user interface de handmatige acties na te laten doen. De stappen die door de ‘robot’ gevolgd worden, worden dus geconfigureerd in de software waarop de software robot draait.
Wat is Power Automate Desktop
Power Automate Desktop is een applicatie die je op je lokale PC kunt draaien en het mogelijk maakt om taken op je lokale PC (of remote) te ondersteunen: Denk bijvoorbeeld aan repetitieve taken of bedrijfsprocessen. Het is een drag&drop oplossing die eenvoudig is in gebruik dankzij de vele bouwstenen die de oplossing biedt en de desktop tegenhanger van Power Automate dat onderdeel is van het Power Platform van Microsoft. Power Automate Desktop is hier te downloaden: Power Automate installeren – Power Automate | Microsoft Learn
Zelf aan de slag
Heb je Power Automate Desktop gedownload? Mooi, dan kunnen we nu echt aan de slag om zelf een simpele RPA oplossing te bouwen. Zoals gezegd gaan we een oplossing bouwen om zelf facturen in PDF formaat uit te lezen. Mocht je hiervoor zelf geen test data hebben, contact ons dan via ons contactformulier: Contact – Datagedreven.eu.
De hierboven beschreven oplossing gaan we bouwen in PowerAutomate. Hierbij gaan we het volgende proces ondersteunen:
- Het ophalen van alle bestanden in een map
- Het extracten van tekst uit al deze bestanden
- Het wegschrijven van deze tekst naar een tekstbestand dat later omgezet kan worden in het juiste formaat.
Hoe we dit gaan maken wordt hieronder beschreven in een aantal stappen:
- Zet alle facturen die je hebt gekregen in een aparte folder:
- Maak een map hoger een tekst bestand aan waar je alle data naartoe gaat schrijven. Dit kan door in een map te gaan staan, op de rechtermuisknop te klikken en vervolgens te kiezen voor Nieuw > Tekstdocument. Noem dit bestand bijvoorbeeld test.txt :
- Als eerste openen we Power Automate Desktop. Dit doe je door in het startscherm te zoeken naar Power Automate. Dit moet wel geïnstalleerd zijn.
- Maak een nieuwe stroom aan
- Geef deze een nieuwe naam en klik op maken:
- In het scherm dat zich opent ziet u links alle mogelijke acties en rechts de stroom zoals u die heeft gemaakt. Deze is in eerste instantie nog leeg. We gaan vooral werken met het zoekvenster bij de acties (zie geel gearceerde veld):
- Voeg een stap toe om alle bestanden uit een map op te halen. Zoek hiervoor op ‘Bestanden in de map ophalen’ en sleep deze naar het stroom schema aan de rechterkant:
- Power Automate zal u vragen om in een dialoog de benodigde instellingen in te geven. Voor nu is het genoeg om de map te selecteren waarin je de facturen hebt gezet. Klik daarna op opslaan.
- Nu hebben we een processtap nodig om alle bestanden die we hebben opgehaald langs te lopen. Hiervoor zoeken we de actie ‘Voor elk’ op en slepen die naar het stroomschema.
- Er komt wederom een dialoog naar boven waarin je zaken dient in te stellen. In dit geval de bestanden waarvoor de ‘Voor elk’ doorlopen moet worden. Klik hiervoor eerst op de {x}.
Vervolgens kun je onder stroomvariabelen op Files klikken en deze selecteren. In het waarde voor iteratie veld komt nu %Files% te staan. Klik op opslaan.
- Nu willen we uit alle bestanden waar we doorheen lopen de tekst extracten. In power automate is hiervoor de actie ‘Tekst uit PDF extraheren’ beschikbaar. Sleep deze in de Voor elke’ sectie. Dus tussen Voor elke en End.
- In de dialoog willen we de PDF bestanden instellen waar we de data uit willen halen. In dit geval zijn dit alle bestanden uit de ‘ Voor elk’ . We klikken derhalve op {x} zodat we hiervoor een proces variabele kunnen instellen.
- We kiezen hierbij voor Current Item. Na het selecteren zal er in het veldje voor PDF bestand %CurrentItem% staan.
- Nu dienen we nog de actie voor het wegschrijven van de tekst toe te voegen. Zoek deze onder de acties en sleep hem net voor ‘End’.
- Nu hoeven we enkel nog het bestand in te stellen waar de tekst naar toe moet worden geschreven. Klik hiervoor op het document icoontje en kies het bestand dat je hebt aangemaakt bij (2). Klik vervolgens bij ‘Te beschrijven tekst’ en klik op {x}. Selecteer hier de stroomvariabele ExtractedPDFTekst, klik op selecteren en klik op opslaan.
- Sla nu de stroom op door rechtsbovenin bij ‘Bestand’ op ‘Opslaan’ te klikken.
- Nu kunt u gaan testen door op ‘play’ te klikken.
- Open het tekstbestand om de resultaten te bekijken
Klaar!
Kijk, dat viel best mee toch? In een paar stappen hebben we nu een eerste, eenvoudige RPA oplossing gemaakt met Power Automate Desktop. Vanaf nu is teksten uit PDFs overtypen niet meer nodig.
Zoals je gezien hebt bij het werken met Power Automate Desktop biedt deze oplossing nog veel meer mogelijkheden. Probeer ze eens!
Of mocht je ondersteuning nodig hebben met RPA binnen jouw organisatie, contact ons dan via Contact – Datagedreven.eu, we kijken graag mee!
Bronnen
Robotgestuurde procesautomatisering – Wikipedia
Robotic Process Automation (RPA) | Microsoft Power Automate