API-integration (Application Programming Interface) er den primære metode til at hente data fra moderne softwaretjenester. I en verden hvor virksomheder bruger 50-200 SaaS-applikationer, er APIs det bindevæv der gør det muligt at samle data fra alle kilder til analyse.
REST APIs (Representational State Transfer) er den mest udbredte API-standard. REST bruger HTTP-metoder (GET, POST, PUT, DELETE) til at interagere med ressourcer identificeret af URLs. JSON er det dominerende dataformat for request- og response-bodies.
GraphQL, udviklet af Facebook i 2012, er et alternativ til REST der lader klienten specificere præcis hvilke data der ønskes. I stedet for faste endpoints med foruddefinerede response-strukturer, sender klienten en forespørgsel der beskriver den ønskede datastruktur. Dette eliminerer over-fetching og under-fetching af data.
Autentifikation er en central udfordring i API-integration. OAuth 2.0 er industristandarden for delegeret adgang, hvor brugere autoriserer tredjepartsapplikationer uden at dele deres password. API-nøgler bruges til server-til-server kommunikation, mens JWT (JSON Web Tokens) bærer autentifikationsinformation i et kompakt, selvstændigt format.
Rate limiting beskytter API-servere mod overbelastning. De fleste APIs begrænser antallet af requests per tidsperiode (for eksempel 100 requests per minut). Robuste integrationer håndterer rate limits med exponential backoff og request queuing.
Webhooks vender API-modellen på hovedet: i stedet for at din applikation spørger efter nye data (polling), sender kildesystemet automatisk data til din applikation, når en hændelse opstår. Stripe sender for eksempel webhooks ved betalinger, og GitHub ved commits.
For dataanalyse i danske virksomheder er de mest relevante APIs typisk Google Analytics, Facebook/Meta Business, Shopify, e-conomic, Dinero, HubSpot og diverse betalingsudbydere. ETL-værktøjer som Fivetran, Airbyte og Stitch automatiserer API-integration og loader data direkte ind i data warehouses.