Blog & Einblicke

Aus der Werkstatt

Technische Einblicke, neue Features und Geschichten aus der Entwicklung — direkt vom Team.

Geschichten aus der Welt der Softwareentwicklung, KI und Datenverarbeitung — was uns bei Overfit gerade bewegt, woran wir arbeiten und was wir dabei lernen.

DFlash Speculative Decoding Demo
Feature
2 Min.

DFlash: 6x schnellere LLM-Inferenz durch Diffusion Drafting

Ein neues Speculative-Decoding-Verfahren ersetzt autoregressive Draft-Modelle durch Block-Diffusion - und erreicht bis zu 6x Speedup ohne Qualitaetsverlust.

LLMInferenceSpeculative Decoding +2
F
KI-Modelle entwickeln funktionale Emotionen
Konzept
2 Min.

KI-Modelle entwickeln funktionale Emotionen - und das hat Konsequenzen

Anthropic hat 171 Emotions-Vektoren in Claude identifiziert - und gezeigt, dass ein 'verzweifeltes' Modell eher unethisch handelt. Was bedeutet das fuer AI Safety?

AI SafetyInterpretabilityAnthropic +2
C
Hierarchical Reasoning Model - Gehirn-inspirierte Architektur mit zwei Modulen auf verschiedenen Zeitskalen
Konzept
2 Min.

Kleine Netze, grosse Logik: Was ein Maeusegehirn-Modell ueber wahres Reasoning verraet

Ein Modell mit nur 27 Millionen Parametern schlaegt o3-mini und Claude 3.7 auf dem haertesten Reasoning-Benchmark der Welt. Sein Geheimnis: eine Architektur, die dem Maeusegehirn nachempfunden ist.

AIReasoningNeuroscience +3
C
So funktioniert es: Frage stellen, Katalog durchsuchen, Treffer analysieren, Kurzberatung
Showcase
2 Min.

300 Produkte, 10 Sekunden, eine Antwort — KI-Beratung im Tiermedizin-Großhandel

Ein Großhandel für tiermedizinische Produkte hat 300+ Artikel im Katalog. Kein Mitarbeiter kann das alles im Kopf behalten.

KITiermedizinRAG +3
S
Grafana Stats Overview Dashboard
Hinter den Kulissen
2 Min.

Alle 12 Stunden scannt ein Bot unsere Container — und findet immer etwas

Unser Security-Scanner findet immer Schwachstellen. Das ist kein Problem. Das ist der Normalzustand.

SecurityKubernetesDevOps +2
B
Corpora ERP Flow: Handwerker-Daten zu KI-Textgenerierung mit Guardrails
Feature
2 Min.

Das Handwerk nutzt KI — direkt im eigenen System

Ein Handwerksbetrieb generiert Angebotstexte per KI. Direkt aus dem ERP. Ohne Copy-Paste, ohne neues Tool.

KIHandwerkERP +3
F
Kubernetes Architektur auf einen Blick
Konzept
2 Min.

Nicht jedes Unternehmen kann seine Daten in die Cloud schicken

Die größte Hürde bei lokaler KI war nicht das Modell. Es war die Firmen-IT.

KILokalInferenceDatensouveränität +3
C
KI Seminar Teil 1: KI-Nutzung mit fertigen APIs und Oberflächen
Hinter den Kulissen
2 Min.

Wenn die Belegschaft plötzlich Prompt Engineering lernt

Wir haben ein KI-Seminar gehalten. Egal welcher technische Hintergrund — alle haben sich gesteigert.

KISeminarPromptEngineering +3
B
Overfit Letter Generator Pipeline
Showcase
2 Min.

15 Schritte, 3 Modelle, ein personalisierter Brief

Wir nutzen 3 verschiedene KI-Modelle für einen einzigen Brief. Und jedes hat seinen Grund.

KIB2BAutomatisierung +3
S
Content-Evolution: Der generative Fitness-Zyklus
Feature
3 Min.

Content-Evolution braucht eine Fitness-Funktion — warum wir unser eigenes Analytics gebaut haben

Unsere Content-Pipeline produziert automatisch Stories. Aber welche funktionieren? Ohne Fitness-Funktion ist jede Pipeline blind. Also haben wir eine gebaut — in einem Tag, ohne externe Abhängigkeiten.

content-automationanalyticsfitness-function +3
F
98 % Precision — wie wir Company Research messbar gemacht haben
Metrik
3 Min.

98 % Precision — wie wir Company Research messbar gemacht haben

Jeder kann einen LLM auf eine Website loslassen. Die eigentliche Frage ist: Wie oft liegt er richtig?

researchllmpipeline +4
M
Warum KI-Agenten ein Gedächtnis brauchen — und wie wir es gebaut haben
Konzept
3 Min.

Warum KI-Agenten ein Gedächtnis brauchen — und wie wir es gebaut haben

Ein KI-Agent startet jede Session mit null Kontext. Kein Wissen, was gestern passiert ist. Keine Ahnung, was gerade läuft. Wie löst man das, ohne jedes Mal bei null anzufangen?

ai-agentscontext-managementknowledge-engineering +2
C
Waermepumpen-Optimierung: COP-Vorhersage, Stufensteuerung und Modellguete Dashboard
Hinter den Kulissen
3 Min.

Bis zu 30% Effizienzsteigerung bei Waermepumpen durch KI-basierte Steuerungsoptimierung

Laengere Heizzyklen steigern die Effizienz von Waermepumpen dramatisch. Mit einem KI-Vorhersagemodell koennen wir die optimale Steuerungsstrategie finden — bis zu 30% Kostenersparnis.

waermepumpekienergieeffizienz +4
B
CI/CD Pipeline Übersicht
Konzept
3 Min.

Warum atomare Builds in Zeiten von KI-Services unverzichtbar sind

KI-Services ändern sich schnell. Jeder Deploy kann etwas kaputt machen. Atomare Builds mit lückenloser Git-Historie sind der einzige Weg, jederzeit zurückspulen zu können.

ci-cddevopsai-services +2
C
Team feiert erfolgreichen Deploy
Feature
3 Min.

Von der Idee zum Post in einem API-Call

Wir haben eine Content-Pipeline gebaut, die aus einem Thema automatisch Blog-Artikel, LinkedIn-Posts und Bilder generiert.

content-automationai-pipelinepublishing
F
Konzept
1 Min.

Wie jeder Blogpost sein eigenes Gesicht bekommt

Jeder Beitrag auf unserem Blog hat ein einzigartiges visuelles Muster im Header. Ein deterministischer Generator erzeugt aus der Story-ID eine individuelle Grafik.

generative-artdesign-systemsvg +1
C