Heute starten wir unblob.ai.
KI ist inzwischen sehr gut darin, mit den richtigen Eingaben zu arbeiten. Schwieriger ist meist der Schritt davor: Inhalte in eine Form zu bringen, die eine KI zuverlaessig verstehen kann.
Die meisten Webseiten und Dateien sind voller Rauschen. Navigation, doppelte Abschnitte, Boilerplate, Layout-Fragmente und kaputte Struktur machen den Inhalt schwer nutzbar. Teams verbringen deshalb oft zu viel Zeit damit, Material erst aufzuraeumen, bevor ein Modell etwas Sinnvolles damit tun kann.
Genau dafuer haben wir unblob.ai gebaut.
Warum wir unblob.ai gebaut haben
Viele Teams wollen KI auf Inhalte anwenden, die bereits existieren: Help-Center-Artikel, Produktdokumentation, PDFs, Reports, Rechnungen und oeffentliche Webseiten.
Das Problem ist: Diese Inhalte kommen fast nie in der richtigen Form an.
Rohes HTML ist zu laut. Copy und Paste zerstoert Struktur. Einfaches Scraping behaelt zu viel Rauschen. Reine Textextraktion entfernt oft genau die Signale, die einem Modell helfen zu verstehen, was wichtig ist.
So entsteht ein bekanntes Muster: Der Inhalt ist da, das Modell ist da, aber die Ergebnisse sind trotzdem nicht verlaesslich.
unblob.ai schliesst genau diese Luecke.
Welches Problem es loest
unblob.ai nimmt eine URL oder eine Datei und verwandelt sie in saubereren, besser nutzbaren Output.
Das Ziel ist einfach: den eigentlichen Inhalt behalten, die Struktur erhalten und alles entfernen, was im Ergebnis nur stoert.
Das bedeutet:
- weniger Boilerplate im finalen Input
- klareres Markdown und besser nutzbare strukturierte Daten
- weniger manuelle Nacharbeit vor Zusammenfassungen, Indexierung oder Extraktion
- eine konsistente Pipeline fuer Webseiten und Dateien
Statt eine eigene Aufraeum-Schicht zu bauen und zu pflegen, kann man direkt mit einem Output starten, der viel naeher an dem ist, was nachgelagerte KI-Systeme brauchen.
Was man damit machen kann
Mit unblob.ai lassen sich Webseiten in Markdown fuer RAG-Pipelines umwandeln, Dateien in strukturierten Output ueberfuehren und Dokumente mit explain schneller verstehen.
Ausserdem laesst sich das Tool ueber die API, SDKs oder MCP-Clients in eigene Workflows und Editor-Umgebungen einbinden.
Der entscheidende Punkt ist nicht nur, dass Inhalte extrahiert werden. Der Output wird leichter pruefbar, leichter nachvollziehbar und leichter in den naechsten Verarbeitungsschritt zu geben.
Wie es weitergeht
Dieser Launch ist erst der Anfang.
Wir werden die Extraktionsqualitaet weiter verbessern, mehr reale Datei- und Seitentypen abdecken und praktische Texte dazu veroeffentlichen, wie man aus unordentlichen Quellen besseren KI-tauglichen Content gewinnt.
Wenn euer Workflow mit dem Satz beginnt: "Erst muessen wir das hier aufraeumen", dann ist unblob.ai fuer euch gebaut.
