Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Mittwoch, 02. Juli 2025.

DuckDB 1.3.0: Revolutionäre Neuerungen für datengetriebene Anwendungen

Krypto-Startups und Risikokapital

Das Geld, dasgeld.co

DuckDB 1. 3.

DuckDB hat mit der Version 1.3.0, auch bekannt unter dem Namen „Ossivalis“, erneut bewiesen, warum es sich zu einer der beliebtesten eingebetteten analytischen Datenbanken entwickelt hat. Die jüngste Veröffentlichung umfasst eine Fülle von neuen Features und wichtigen Verbesserungen, die den Umgang mit großen Datenmengen effizienter, schneller und benutzerfreundlicher machen. Diese Version ist besonders für Nutzer interessant, die moderne Datenwerkzeuge benötigen – ob in Data Science, Business Intelligence oder in der Embedded-Analyse von Datenstreams.

Die Integration von neuen SQL-Funktionalitäten und Performance-Optimierungen machen DuckDB 1.3.0 zu einem echten Meilenstein. Ein zentraler Faktor in diesem Update ist die Weiterentwicklung der Lambda-Funktionssyntax. Bisher verwendete DuckDB die sogenannte Single-Arrow-Syntax (x -> x + 1), die jedoch in Konflikt mit der JSON-Extension stand, da auch der Pfeiloperator für JSON-Felder genutzt wird.

Diese Dopplung führte oft zu Verwirrung und Fehlern bei Nutzern. Mit der neuen Version wird stattdessen eine Python-ähnliche Lambda-Syntax eingeführt, die den Code lesbarer macht und Fehlermöglichkeiten reduziert. Beispielsweise können Transformationen nun mit Konstrukten wie lambda x: x + 1 ausgedrückt werden, was den Umgang mit Funktionen vereinfacht und konsistenter gestaltet. Allerdings gibt es eine Übergangsphase, in der beide Syntaxformen noch unterstützt werden. Dabei werden Entwickler durch entsprechende Einstellungen die Möglichkeit erhalten, schrittweise auf die neue Syntax umzusteigen.

Für den Betrieb auf älteren Linux-Systemen hat DuckDB 1.3.0 eine wichtige Änderung: Die offiziellen Linux-Binaries setzen jetzt mindestens glibc 2.28 voraus. Da alle gängigen Linux-Distributionen mittlerweile neuere Versionen besitzen, trägt dies zur Standarisierung und besseren Performance bei.

Nutzer älterer Systeme können die Datenbank weiterhin aus dem Quellcode selbst kompilieren, um Kompatibilität zu gewährleisten. Die Arbeit mit externen Dateien wurde mit dem neu implementierten externen Datei-Cache erheblich beschleunigt. DuckDB wird häufig verwendet, um Daten von entfernten Speichern wie S3 Buckets oder HTTP-Servern zu lesen. In früheren Versionen musste jede Abfrage diese Daten komplett neu laden. Der Cache bewahrt nun Daten im Arbeitsspeicher solange ausreichend Platz vorhanden ist.

Damit lassen sich wiederholte Abfragen auf entfernte Daten deutlich schneller ausführen. Gerade bei Analyse-Workflows, bei denen Daten oft mehrfach gelesen und verarbeitet werden, ist dieser Fortschritt entscheidend für eine bessere Gesamtperformance. Der Cache kann durch spezielle Tabellenausgaben sogar vom Anwender eingesehen und bei Bedarf deaktiviert werden. Auch das Kommandozeilen-Interface (CLI) von DuckDB wurde erweitert: Ab sofort können Nutzer direkt Parquet-, CSV- und JSON-Dateien abfragen, ohne erst eine Datenbank öffnen oder importieren zu müssen. Dies geschieht, indem beim Aufruf der CLI eine Datei übergeben wird, woraufhin dynamisch zwei Sichten eingerichtet werden – eine generische namens file und eine benannte Sicht basierend auf dem Dateinamen.

Diese Funktion bietet eine immense Usability-Erleichterung, da man bequem in der Shell navigieren und direkt Abfragen auf lokalen Dateien ausführen kann. Ein weiterer Fortschritt ist das etablierte TRY-Expression-Feature. Bekannt war bisher TRY_CAST, das beim fehlerhaften Konvertieren NULL statt eines Fehlers zurückgab. DuckDB 1.3.

0 erweitert dieses Konzept auf beliebige Ausdrücke. Das bedeutet, dass kritische Ausdrucksfehler, etwa beim Berechnen des Logarithmus von null, nicht mehr die gesamte Abfrage abbrechen, sondern stattdessen NULL zurückgeben. Dies steigert die Robustheit von Datenverarbeitungsskripten, wenn unvorhergesehene Werte auftreten. Trotzdem empfiehlt sich ein bewusster Einsatz von TRY, da das Verhalten intern die Verarbeitung optimieren muss und häufige Fehler die Leistung negativ beeinflussen können. Mit der Möglichkeit, Strukturen (STRUCTs) innerhalb von Tabellen zu verändern, geht DuckDB einen weiteren Schritt Richtung flexibler Datenmodellierung.

Nutzer können jetzt einzelne Felder in verschachtelten Strukturen hinzufügen, löschen oder umbenennen, ohne die ganze Tabelle neu erstellen zu müssen. Dies gilt auch für komplexere Typen wie Listen oder Maps, was insbesondere für dynamische und hierarchische Datensätze Vorteile bringt. Die neue Funktion ATTACH OR REPLACE unterstützt verbesserte Verwaltung mehrerer Datenbanken, indem sie den schnellen Austausch einer Datenbank im laufenden Betrieb erlaubt. Diese Neuerung erleichtert vor allem Entwicklungsprozesse und Testszenarien, bei denen Versionen von Datenbanken häufig gewechselt werden müssen. Im Bereich der UUIDs führt DuckDB 1.

3.0 die Unterstützung für UUID Version 7 ein, ein modernes Format, das anhand eines Unixzeitstempels und zufälliger Bits sowohl Eindeutigkeit als auch Sortierbarkeit ermöglicht. Diese Kombination erlaubt es, UUIDs sinnvoll nach Erstellungszeit zu ordnen, was für zeitbezogene Datenanalysen und Optimierungen von großem Nutzen ist. Lediglich ein kurzer Hinweis zur Version 1.3.

0: Die Implementierung enthielt einen Fehler bezüglich der Timestamps in UUIDv7, der in einer bevorstehenden Patch-Version korrigiert wird. DuckDB adressiert auch Sicherheitsaspekte und das Management von Geheimnissen („Secrets“). Durch die Einführung der Unterstützung von Ausdrucksevaluierungen beim Erstellen von Secrets lassen sich Zugangsdaten, Tokens oder Credentials flexibler und sicherer definieren. So können z.B.

Umgebungsvariablen oder zuvor gespeicherte Werte dynamisch eingesetzt werden, was sensible Informationen besser vor Logfiles schützt. Darauf aufbauend erleichtert die neue Syntax das Einbinden von externen Anmeldeinformationen in Cloud-Umgebungen oder verteilten Systemen erheblich. Die SQL-Syntax bekommt mit der UNPACK-Funktion zusätzlich eine praktische Erweiterung. Sie erlaubt das Extrahieren und Umwandeln mehrerer Spalten in Listen inklusive Typecasts, was vorher nicht ohne weiteres möglich war. Das verbessert die Handhabung von dynamischen Resultaten und fördert flexiblere Analysen etwa in Data-Transformation-Pipelines.

Besonders hervorzuheben ist der neue Spatial JOIN Operator, welcher die Leistungsfähigkeit räumlicher Abfragen mit Geometrie-Daten entscheidend erhöht. Dabei wird intern eine R-Tree-basierte Strukturdatenbank auf der kleineren Joins-Seite aufgebaut, ähnlich wie beim Hash Join, aber für räumliche Daten optimiert. Das hat zur Folge, dass komplexe Raumabfragen wie ST_Intersects oder ST_Contains nun bis zu hundertmal schneller und ohne vorheriges Indexieren laufen. Diese Innovation macht DuckDB zu einem attraktiven Tool für Geodatenanalysen, beispielsweise in GIS-Anwendungen oder bei Analyse von Standortdaten. Im Hintergrund hat DuckDB mit umfassenden Überarbeitungen beim Parquet-Dateileser und -schreiber sowie der MultiFileReader API aufgerüstet.

Die einheitliche Handhabung von mehreren Dateien und unterschiedlichen Schemas in Formaten wie Parquet, CSV, JSON und Avro verbessert die Robustheit erheblich. Das bekannte Parquet-Format profitiert zudem von besserer Performance und der Unterstützung ungewöhnlicher Datentypen wie FLOAT16 oder UNKNOWN. Auf der Speicherseite wurde ein neuer Kompressionsmodus für Strings eingeführt, der die Vorteile von Dictionary-Encoding und FSST-Kompprimierung kombiniert. Mit DICT_FSST entsteht eine effiziente Speicherverwaltung, die vor allem bei heterogenen Datenblöcken weniger Platz benötigt. Diese automatische Auswahl des Kompressionsverfahrens durch DuckDB hilft Nutzern, optimale Speichereffizienz bei minimalem Aufwand zu erzielen.

Das Update 1.3.0 steht stellvertretend für den rasanten Innovationszyklus von DuckDB. Über 3.000 Commits wurden von mehr als 75 Entwicklerinnen und Entwicklern umgesetzt, darunter viele wertvolle Beiträge aus der Community.

Der Fokus liegt dabei auf einer engen Verzahnung von hoher Performance, einfacher Nutzbarkeit und moderner SQL-Funktionalität. Durch die steigende Integration in diverse Programmiersprachen und Ökosysteme wächst DuckDB beständig als leistungsfähige und gleichzeitig leichtgewichtige Alternative zu traditionellen Datenbanksystemen. Die neuen Funktionen wie der externe Dateicache oder der direkte Zugriff auf Dateien im CLI sprechen besonders Anwender an, die große Datenmengen flexibel, performant und mit minimaler Infrastruktur analysieren möchten. Abgerundet wird das Paket durch vielfältige Verbesserungen am SQL-Syntax, Fehlerbehandlung und Sicherheitsfeatures rund um Secrets. Zusammenfassend bietet DuckDB 1.

3.0 eine attraktive Kombination aus Innovation und Stabilität für moderne Datenanwendungen. Die Einführung einer klaren und robusten Lambda-Syntax, der enorme Boost bei räumlichen Datenanfragen und die verbesserten Mechanismen für den Umgang mit externen Datenquellen sind nur einige der vielen Gründe, warum sich ein Upgrade lohnt. Vor allem Anwender, die mit verteilten Datenspeichern oder Cloud-Szenarien arbeiten, profitieren von den Verbesserungen bei der Dateiverwaltung und dem neuen Caching-System. Insgesamt beweist DuckDB mit der Version 1.

3.0, dass eine lokal eingebettete analytische Datenbank nicht nur mit den großen Systemen mithalten kann, sondern auch durch innovative Konzepte neue Standards setzt. Ob für Data Scientists, Entwickler oder Datenbank-Administratoren: Die neuen Features eröffnen vielfältige Nutzungsmöglichkeiten und erleichtern den Umgang mit komplexen, heterogenen und großen Datensätzen erheblich. Die fortlaufende Weiterentwicklung und das aktive Engagement der Community versprechen, dass DuckDB auch in Zukunft eine Schlüsselrolle im Bereich der datengetriebenen Anwendungen spielen wird.

Als Nächstes

Ask HN: How are you using LLMs for research on a library of journal articles?

Mittwoch, 02. Juli 2025. Wie Nutzung von LLMs die Forschung in wissenschaftlichen Bibliotheken revolutioniert

Erfahren Sie, wie große Sprachmodelle (LLMs) Forschern dabei helfen, umfangreiche Sammlungen wissenschaftlicher Artikel effizient zu durchsuchen, zu analysieren und neue Erkenntnisse zu gewinnen – unter Berücksichtigung von Kosten, Geschwindigkeit, Genauigkeit und Datenschutzaspekten.

Apply for the Llama Startup Program by Meta

Mittwoch, 02. Juli 2025. Llama Startup Program von Meta: Eine Chance für Early-Stage Startups im Bereich generative KI

Das Llama Startup Program von Meta bietet jungen Unternehmen in den USA umfangreiche Unterstützung, finanzielle Förderung und technischen Support, um innovative Anwendungen mit generativer KI zu entwickeln und so im wettbewerbsintensiven Markt erfolgreich zu sein.

Instant IP Portfolio Reports from Public Data (No Uploads)

Mittwoch, 02. Juli 2025. Sofortige IP-Portfolio-Berichte aus öffentlichen Daten: Effiziente und umfassende Analyse ohne Uploads

Erfahren Sie, wie Instant IP-Portfolio-Berichte auf Basis öffentlicher Daten Unternehmen, Investoren und Strategen dabei helfen, fundierte Entscheidungen zu treffen. Nutzen Sie AI-gestützte Analysen zur Bewertung von Patenten, Marken und weiteren geistigen Eigentumsrechten über 127 Jurisdiktionen hinweg.

Enrichx AI transaction and merchant enrichment

Mittwoch, 02. Juli 2025. Enrichx AI: Revolutionäre Echtzeit-Transaktions- und Händleranreicherung für die Finanzwelt

Enrichx AI bietet eine innovative Lösung zur Echtzeitanreicherung von Finanztransaktionsdaten. Mit über 95 % Genauigkeit verwandelt die Plattform unstrukturierte und unklare Transaktionsdaten in verständliche, kontextspezifische Informationen, die sowohl Banken als auch Fintech-Unternehmen und Endkunden zugutekommen.

HuggingFace: Model Context Protocol (MCP) Course

Mittwoch, 02. Juli 2025. Model Context Protocol (MCP) Kurs von Hugging Face: Die Zukunft der KI-Anwendungsentwicklung

Entdecken Sie den Model Context Protocol (MCP) Kurs von Hugging Face, der umfassend Wissen rund um die neuesten KI-Standards vermittelt. Erfahren Sie, wie Sie MCP verstehen, anwenden und eigene KI-Anwendungen mit externen Daten und Tools entwickeln können, um im schnell wachsenden Bereich der Künstlichen Intelligenz erfolgreich zu sein.

Coinbase Sued in Nationwide Class Actions Over Data Breach

Mittwoch, 02. Juli 2025. Coinbase im Visier: Bundesweite Sammelklagen nach großem Datenleck erschüttern Krypto-Branche

Die populäre Kryptowährungsbörse Coinbase steht nach einem schwerwiegenden Datenverstoß im Mittelpunkt bundesweiter Sammelklagen. Die rechtlichen Konsequenzen unterstreichen die wachsende Bedeutung von Sicherheit im digitalen Finanzsektor und werfen Fragen zur Zukunft zentralisierter Krypto-Handelsplattformen auf.

Crispr Therapeutics call volume above normal and directionally bullish

Mittwoch, 02. Juli 2025. Crispr Therapeutics: Steigende Call-Optionen signalisieren bullische Stimmung am Markt

Crispr Therapeutics verzeichnet eine ungewöhnlich hohe Call-Optionsaktivität, die auf positive Erwartungen der Investoren hindeutet. Diese Entwicklung steht im Kontext einer steigenden impliziten Volatilität und erwartetem nächsten Quartalsergebnis, was die strategische Bedeutung des Unternehmens für die Biotechnologiebranche unterstreicht.