Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Sonntag, 18. Mai 2025.

FOMO: Revolutionäre Objekterkennung mit 60fps für ressourcenbeschränkte Geräte wie Raspberry Pi

Dezentrale Finanzen Virtuelle Realität

Das Geld, dasgeld.co

FOMO: 60fps object detection for constrained devices like RPi

Entdecken Sie, wie FOMO die Objekterkennung auf ressourcenbeschränkten Geräten wie dem Raspberry Pi revolutioniert, indem es höchste Geschwindigkeit bei minimalem Energie- und Speicherverbrauch ermöglicht. Lernen Sie, warum FOMO eine wegweisende Technologie für Echtzeitanwendungen auf kleinen Embedded-Systemen ist und wie es traditionelle Ansätze übertrifft.

In der heutigen Welt, in der das Internet der Dinge (IoT) und Edge-Computing immer mehr an Bedeutung gewinnen, stehen Entwickler und Unternehmen vor der Herausforderung, komplexe Aufgaben wie die Objekterkennung auf limitierten Geräten effizient umzusetzen. Herkömmliche machine-learning-Modelle bieten zwar beeindruckende Ergebnisse auf leistungsstarken GPUs oder Servern, stoßen jedoch auf ressourcenbeschränkten Plattformen wie dem Raspberry Pi oft an ihre Grenzen. FOMO, ein innovativer Algorithmus für Objekterkennung speziell für solche eingeschränkten Geräte, bringt frischen Wind in diese Problematik und ermöglicht beeindruckende 60 Bilder pro Sekunde (fps) bei der Objekterkennung auf dem Raspberry Pi 4 und sogar auf Mikrocontroller-basierten Boards mit sehr begrenztem Speicher und Rechenleistung. FOMO steht für „Faster Objects, More Objects“ und stellt eine völlig neue Methode der Objekterkennung dar, die speziell für ressourcenbeschränkte Hardware entwickelt wurde. Während typische Modelle wie MobileNet SSD oder YOLOv5 sehr rechenintensiv sind und dadurch nur wenige Frames pro Sekunde auf kleineren Geräten erreichen, ermöglicht FOMO eine drastische Reduzierung des Rechenaufwands und des Speicherbedarfs, ohne dabei grundlegend an Genauigkeit einzubüßen.

Dies ist vor allem durch die innovative Nutzung von Positionserkennung durch sogenannte Heatmaps möglich, anstatt aufwändige Bounding-Box-Berechnungen durchzuführen. Bei der klassischen Bildklassifikation wird das gesamte Bild analysiert und eine einzige Entscheidung getroffen, beispielsweise ob ein Gesicht vorhanden ist oder nicht. Diese Methode liefert jedoch keine Informationen über die genaue Position oder die Anzahl der Objekte im Bild. Dagegen bieten klassische Objekterkennungsalgorithmen detaillierte Daten über die Lage und Größe von Objekten, benötigen aber wesentlich mehr Rechenressourcen und umfangreiche Datenmengen für das Training. FOMO kombiniert das Beste aus beiden Welten: Es arbeitet mit der Effizienz einer Bildklassifizierung, liefert jedoch gleichzeitig präzise Informationen über die Position und Anzahl der Objekte.

Der Schlüssel zur Funktionsweise von FOMO liegt in seiner Architektur, die auf tiefen neuronalen Netzen basiert und die letzte Klassifikationsschicht durch eine räumliche Heatmap ersetzt. Diese Heatmap zeigt für jede Region des Bildes eine Klassifizierungswahrscheinlichkeit an, wodurch eine genaue Lokalisierung auf einer fein unterteilten Karte ermöglicht wird. So wird das Bild nicht nur als Ganzes verstanden, sondern in kleinere Bereiche zerlegt, für die separat klassifiziert wird. Das ermöglicht eine genaue Identifikation und Zählung mehrerer Objekte, selbst wenn diese nah beieinander liegen. Das Modell reduziert also die Aufgabe der Objekterkennung auf eine lokale Klassifizierung mittels eines vollständig konvolutionalen neuronalen Netzes.

Die quadratischen Heatmap-Zellen entsprechen jeweils einem bestimmten Bereich im Eingabebild, wodurch die räumliche Beziehung beibehalten wird. Dies ist um ein Vielfaches effizienter als herkömmliche Methoden, die zunächst mehrere Regionen vorschlagen und danach einzeln klassifizieren müssen. Ein weiterer essenzieller Aspekt von FOMO ist die Verwendung des MobileNetV2 als Basisarchitektur. MobileNetV2 ist bereits für seine Rechen- und Speicherfreundlichkeit bekannt, und FOMO nutzt den vortrainierten Backbone dieses Modells, um so eine solide Basis für die Erkennung zu schaffen. Dabei wird der Netzwerk-Teil, der typischerweise zu einer einzigen Klassifikation führt, entfernt und durch eine eigene kleine Schicht ersetzt, die eine Heatmap pro Objektklasse erzeugt.

Die Anpassbarkeit des Modells erlaubt es, zwischen verschiedenen Intensitäts- und Genauigkeitsstufen zu wechseln. So kann beispielsweise die Downsampling-Rate der Heatmap variiert werden, wodurch die Auflösung der Erkennung gezielt beeinflusst wird. Eine sehr hohe Auflösung ermöglicht die Erkennung von vielen, auch kleinen Objekten, geht aber mit einem höheren Rechenaufwand einher. Für viele praktische Anwendungen reicht jedoch eine reduzierte Auflösung vollkommen aus. Beeindruckend ist zudem die Flexibilität in Bezug auf die Eingabebildgrößen.

FOMO funktioniert in gleicher Weise auf kleinen Bildern wie 96x96 Pixel, die in vielen Embedded-Anwendungen üblich sind, als auch auf größeren Bildern wie 320x320 oder gar 1024x1024. Damit ist es möglich, verschiedene Einsatzfälle abzudecken: von kleinen Überwachungskameras bis hin zu industriellen Qualitätskontrollen, bei denen auch kleinste Fehler erkannt werden müssen. Ein praxisnahes Beispiel aus der Edge-Impulse-Community zeigt, dass FOMO auf einem Raspberry Pi 4 realistische 60 Bilder pro Sekunde bei einer Auflösung von 160x160 Graustufenbildern erreicht. Zur Veranschaulichung wurde ein Modell zum Erkennen von Bierflaschen und Dosen entwickelt, das live auf der Plattform läuft. Im Vergleich schafft das MobileNet SSD Modell auf dem selben Gerät nur etwa 3 fps – damit übertrifft FOMO frühere Ansätze um das bis zu 20-fache.

Auf noch ressourcenärmeren Geräten wie dem Arduino Nicla Vision mit Cortex-M7 Prozessor sind ebenfalls echte Echtzeit-Raten möglich. Hier erreicht FOMO beeindruckende 30 Bilder pro Sekunde bei weniger als 250 Kilobyte RAM-Verbrauch. Das ermöglicht erstmals komplexe Objekterkennung sogar auf kleinen Mikrocontroller-Plattformen, die bislang nur für einfache Klassifikationsaufgaben in Frage kamen. Grund für diese Effizienz ist neben der Modellarchitektur auch die Verwendung spezieller Compiler wie den EON Compiler von Edge Impulse, der das Modell für die Zielhardware optimiert kompiliert und damit die Laufzeit deutlich verkürzt. Ein interessanter Punkt bei der Anwendung von FOMO ist die Abkehr von klassischen Bounding-Box-Indikatoren.

FOMO wurde auf die Erkennung von Objektzentroiden trainiert, was in vielen Szenarien ausreicht, da die genaue Größe der Objekte oft unwichtig ist – insbesondere bei festen Kamerapositionen und konstanten Objektgrößen. Die Netzwerkausgabe zeigt in der Heatmap unmittelbar, wo die Objekte zu finden sind, und daraus können bei Bedarf Bounding-Boxen recht einfach abgeleitet werden. Natürlich hat diese Methode auch Einschränkungen: Wenn sich Objekte zu dicht überlappen und sich somit Centroiden annähern, kann es zu Interferenzen in der Heatmap kommen, die eine präzise Trennung verhindern. Dies lässt sich jedoch durch Erhöhen der Heatmap-Auflösung reduzieren, was wiederum etwas mehr Rechenleistung erfordert. Für Entwickler und Unternehmen ergeben sich dadurch ganz neue Möglichkeiten der Echtzeitbildverarbeitung auf Edge-Geräten.

Natürliche Einsatzgebiete finden sich in Sicherheitskameras, industriellen Überwachungssystemen, smarten Haushaltsgeräten oder auch in der Landwirtschaft, beispielsweise zur Zählung von Tieren oder Früchten. Dank der Kombinierbarkeit mit Transfer Learning kann FOMO zudem an spezifische Anwendungsbereiche angepasst werden, ohne von Grund auf neu trainiert werden zu müssen. Die Handhabung von FOMO wird durch Tools wie Edge Impulse erleichtert. Hier kann man eigene Bilddatensätze einfach annotieren, Modelle trainieren und anschließend schnell auf verschiedene Hardware exportieren. Der Export als C++-Bibliothek erlaubt es, FOMO problemlos in bestehende Firmware oder Software-Stacks zu integrieren.

Das begünstigt die schnelle Umsetzung produktionsreifer Lösungen. Im Bereich der Leistungsoptimierung bietet FOMO zudem Expertenoptionen zur Feinjustierung. So kann beispielsweise die Gewichtung der Objekterkennung gegenüber dem Hintergrund in der Verlustfunktion angepasst werden, um seltene Objekte fokussierter zu detektieren. Ebenso lassen sich Elemente des MobileNet Backbone manipulieren, um eine Balance zwischen Modellgröße, Geschwindigkeit und Genauigkeit zu finden. Diese Flexibilität gewährleistet, dass FOMO sowohl auf kleinen Mikrocontrollern mit 80 MHz als auch auf kräftigen ARM-basierten Boards problemlos läuft.

Die minimalen Hardwareanforderungen für FOMO liegen im Bereich von 256 Kilobyte RAM bei kleineren Eingabebildern. Empfohlen werden jedoch mindestens 512 Kilobyte, um mehr Spielraum für größere Bilder und komplexere Modelle zu haben. Die Auswahl der richtigen Hardware ist dabei entscheidend, um den gewünschten Durchsatz von Frames pro Sekunde zu erreichen. Auch die Zukunftsperspektiven für FOMO sind vielversprechend. Die Entwickler arbeiten an Verbesserungen wie UNet-artigen Architekturen, die noch präzisere Segmentierungen und Erkennungen ermöglichen sollen.

Als Nächstes

I Built a Personal MCP for My Blog with an Agent Net Promoter Score of 33

Sonntag, 18. Mai 2025. Mein Persönlicher MCP für den Blog: Agentenfeedback und ein Net Promoter Score von 33

Erfahren Sie, wie ein persönlicher Model Context Protocol (MCP) Server für einen Blog eingerichtet wird, um Agentenfeedback zu sammeln und die Nutzererfahrung zu verbessern. Lernen Sie die Bedeutung des Agent Net Promoter Scores (ANPS) kennen und entdecken Sie, wie die Integration von Feedbackprozessen durch ein MCP neue Möglichkeiten für die Interaktion mit KI-Agenten eröffnet.

NFTs are Stealing Passwords from the Solana cryptocurrency owners using malware

Sonntag, 18. Mai 2025. Gefährliche NFT-Malware: Wie Solana-Krypto-Nutzer durch gefälschte NFTs ihre Passwörter verlieren

Ein alarmierender Cyberangriff richtet sich gegen Solana-Kryptowallet-Besitzer: Gefälschte NFTs verbreiten schädliche Malware, die darauf abzielt, Passwörter und sensible Browserinformationen zu stehlen. Diese Entwicklung fordert erhöhtes Sicherheitsbewusstsein in der Krypto-Community.

Bitcoin mining pushes sustainability agenda with over 50% of energy generated from renewables

Sonntag, 18. Mai 2025. Bitcoin Mining und Nachhaltigkeit: Über 50 % des Energieverbrauchs stammen aus erneuerbaren Quellen

Die Bitcoin-Mining-Industrie setzt verstärkt auf nachhaltige Energiequellen und verbessert ihre Effizienz deutlich. Trotz steigendem Stromverbrauch wächst der Anteil erneuerbarer Energien konstant und verleiht dem Sektor eine zukunftsfähige Basis.

Sonntag, 18. Mai 2025. Der Anfängerleitfaden für Reinforcement Learning: Entdecke das RL Playground

Ein ausführlicher Leitfaden, der die Grundlagen des Reinforcement Learning und die Funktionen des Beginner's RL Playground erläutert und dabei wichtige Konzepte wie Q-Learning und ε-greedy Exploration verständlich macht.

NIST Privacy Framework 1.1: Initial Public Draft [pdf]

Sonntag, 18. Mai 2025. NIST Privacy Framework 1.1: Ein umfassender Leitfaden für den Datenschutz der Zukunft

Ein detaillierter Überblick über das NIST Privacy Framework 1. 1, das Unternehmen und Organisationen dabei unterstützt, Datenschutzrisiken effektiv zu managen und die Privatsphäre von Personen im digitalen Zeitalter zu schützen.

Semler Scientific buys another $10M worth of BTC

Sonntag, 18. Mai 2025. Semler Scientific setzt mit Bitcoin-Investition neue Maßstäbe in der Gesundheitsbranche

Semler Scientific hat erneut in Bitcoin investiert und sein Portfolio um 10 Millionen US-Dollar erweitert. Diese strategische Entscheidung unterstreicht die zunehmende Bedeutung von Kryptowährungen für Unternehmen, insbesondere im Gesundheitssektor, und zeigt neue Wege der Kapitalallokation auf.

Semler Scientific Pushes Bitcoin Stack to Over 3,300 BTC With $10M Buy

Sonntag, 18. Mai 2025. Semler Scientific erhöht Bitcoin-Bestand auf über 3.300 BTC mit 10-Millionen-Dollar-Investition

Semler Scientific, ein führendes Unternehmen im Bereich medizinischer Geräte, erweitert sein Bitcoin-Portfolio durch einen strategischen Kauf von 111 Bitcoin im Wert von 10 Millionen US-Dollar. Dieser Schritt unterstreicht die zunehmende Integration von Kryptowährungen in den Unternehmensfinanzen und spiegelt das wachsende Vertrauen in Bitcoin als langfristige digitale Wertanlage wider.