Die IEEE International Symposium on Field-Programmable Custom Computing Machines, kurz FCCM, fand im Mai 2025 erneut statt und bot erneut eine Plattform für den intensiven Austausch von Ideen, Forschungsergebnissen und visionären Technologien im Bereich der programmierbaren spezialisierten Rechenmaschinen. Nach einigen Jahren, in denen gerade persönliche Teilnahmen der Fachwelt aufgrund der Pandemie erschwert waren, zeigte die diesjährige Ausgabe des Kongresses eine gesunde und lebendige Community, die das Potenzial von FPGAs (Field Programmable Gate Arrays) und verwandten Technologien weiter vorantreibt. Die FCCM hat sich über die Jahrzehnte als feste Institution in der Welt der maßgeschneiderten Rechenarchitekturen etabliert und blieb auch 2025 ein Schaufenster für die neuesten Innovationen und akademischen Fortschritte auf diesem Gebiet. Zu Beginn der Konferenz stand eine Podiumsdiskussion mit dem Titel „Die Zukunft der FCCMs jenseits von Moores Gesetz“ im Fokus. Diese Diskussion stellte einen essenziellen Themenkomplex dar, da die traditionelle Miniaturisierung von Halbleiterbauelementen zunehmend an ihre Grenzen stößt.
Eingeladen waren Experten aus Industrie und Wissenschaft, unter anderem Vertreter von AMD, Altera und Waymo. Gemeinsam wurden sowohl die Herausforderungen als auch die Chancen thematisiert, die sich aus dem Ende der technologischen Scaling-Ära ergeben. Während in der Vergangenheit die Performance-Gewinne vor allem durch kleinere Strukturen erzielt wurden, verändert sich das Spielfeld zunehmend hin zu neuartigen architektonischen Ansätzen und innovativen Compilertechnologien. Die Teilnehmer betonten die Bedeutung intellektueller Fortschritte, die sich nicht ausschließlich auf physikalische Miniaturisierung verlassen, sondern vielmehr neue Wege in Design und Nutzung von FPGAs ebnen. Ein zentrales Thema der Diskussion war die Erkenntnis, dass viele Unternehmen seit Jahrzehnten vergeblich versuchen, den traditionellen FPGA und Mikroprozessor durch sogenannte Post-Moore-Alternativen zu ersetzen.
Trotz innovativer Ideen und teilweise hervorragender architektonischer Konzepte sowie leistungsfähiger Compiler- und Design-Tools hat es bislang keine durchschlagende kommerzielle Lösung gegeben. Dieses Spannungsfeld zwischen akademischer Forschung und Marktrealitäten wurde kritisch beleuchtet, wobei der berühmte Wirtschaftswissenschaftler John Maynard Keynes zitiert wurde, um die Diskrepanz zwischen Marktlogik und nachhaltiger Innovation zu verdeutlichen. Neben der Podiumsdiskussion bot die FCCM 2025 eine Vielzahl hochkarätiger Paper, die wichtige Fortschritte in unterschiedlichen Forschungsgebieten präsentieren. Besonders hervorzuheben ist die Arbeit „AutoNTT“, die sich mit der automatisierten Architekturentwicklung und -erforschung für die Beschleunigung der Zahlentheoretischen Transformation auf FPGAs beschäftigt. Zahlentheoretische Transformationen spielen eine zentrale Rolle in der Signalverarbeitung und Kryptografie, weshalb effiziente FPGA-Implementierungen große praktische Relevanz besitzen.
Die Forschungsarbeit wurde von der Simon Fraser Universität vorgestellt und überzeugte durch ihre methodische Tiefe und praktische Anwendbarkeit. Ein weiteres Highlight stellte „RealProbe“ dar, eine automatisierte und ressourcenschonende Performance-Profiler-Lösung für hochrangige Synthese-Designs, die direkt auf FPGA-Hardware ausgeführt werden können. Diese Entwicklung ermöglicht es Designern und Forschern, den Echtzeitbetrieb von mittels High-Level-Synthesis (HLS) erzeugten Schaltungen besser zu verstehen und zu optimieren. Die Arbeit wurde von der Georgia Tech präsentiert und konnte durch ihren innovativen Ansatz großes Interesse wecken. Auch die Universität von Südkalifornien präsentierte wichtige Fortschritte im Bereich der Hochdurchsatz-Matrixtransposition mit HBM-fähigen FPGAs.
Hochbandbreitiger Speicher (HBM) ist ein essentieller Baustein für moderne Hardwarelösungen, die hohe Datenraten erfordern, etwa im maschinellen Lernen oder der wissenschaftlichen Simulation. Die vorgestellte Arbeit aus der Arbeitsgruppe um Viktor Prasanna zeigte, wie sich über effiziente Algorithmen und Hardwaredesigns bedeutende Leistungssteigerungen erzielen lassen. Besonders beeindruckend war auch die Präsentation „ITERA-LLM“ aus dem Imperial College, die sich mit der Beschleunigung von Sub-8-Bit Large Language Model Inferenz durch iterative Tensorzerlegung befasst. Angesichts des enormen Wachstums und der zunehmenden Bedeutung von KI und großen Sprachmodellen ist die Optimierung solcher Modelle auf FPGA-Architekturen von großer Bedeutung. Die vorgestellte Methode zeigt, wie Ressourcenbedarf und Latenzen reduziert werden können, was eine effizientere Inferenz ermöglicht.
Die Sitzung wurde zusätzlich durch das prämiertes Paper „Guaranteed Yet Hard to Find: Uncovering FPGA Routing Convergence Paradox“ von der EPFL abgerundet. Diese Arbeit beschreibt ein interessantes Phänomen bei der FPGA-Routingkonvergenz und liefert Erkenntnisse, die für Design-Tool-Entwickler und FPGA-Anwender gleichermaßen von strategischer Relevanz sind. Die Konferenz verlieh diesem Beitrag zudem den Best Paper Award, was dessen hohe wissenschaftliche Qualität und Innovationskraft unterstreicht. Neben diesen Beiträgen präsentierte die Gruppe um George Constantinides, eines der Schwergewichte der FCCM-Community, zwei eigene bedeutende Arbeiten. Ein Paper beschäftigte sich mit banked Memories für Soft-SIMT-Prozessoren – eine Zusammenarbeit mit Martin Langhammer von Altera.
Ziel der Arbeit war es, die Speicherarchitektur in FPGA-basierten Softprozessoren so zu entwickeln, dass sie effizienter und mit höheren Taktraten arbeitet. Langhammers Doktorarbeit prägt das Verständnis und die Methodik solch hochfrequenter Designs erheblich, da sie auf physikalische Effekte und Designrealitäten fokussiert, die oft unterschätzt werden. Die zweite Arbeit unter Federführung von Constantinides und seiner Doktorandin Marta Andronic trägt den Titel „NeuraLUT-Assemble: Hardware-aware Assembling of Sub-Neural Networks for Efficient LUT Inference“. Dieses Projekt stellt einen großen Schritt in der LUT-basierten Ansatzweise neuronaler Netze auf FPGAs dar. Durch die Zerlegung großer Lookup-Tabellen (LUTs) in kleinere, hierarchische Strukturen sowie eine hardwarebewusste Methode zur Erkennung sparsamer Muster konnte ein bedeutender Zugewinn an Effizienz und Leistungsfähigkeit erzielt werden.
Marta Andronics Forschung ist wegweisend, da sie herkömmliche Grenzen der LUT-Inferenz überwindet und damit maßgeblich zur Optimierung von FPGA-basierten neuronalen Netzwerken beiträgt. Der Austausch auf der Konferenz war insgesamt sehr gewinnbringend. Neben dem fachlichen Input standen auch die persönlichen Begegnungen und die Netzwerkmöglichkeiten wieder im Mittelpunkt, was nach pandemiebedingter längerer Pause von vielen Teilnehmern als besonders wertvoll empfunden wurde. Die Atmosphäre war offen und von einem starken Anteil an gemeinschaftlicher Forschung und Entwicklung geprägt, was das FCCM als Treffpunkt für Fachleute und Wissenschaftler weiter festigt. Ein Blick in die Zukunft zeigt, dass die Spannbreite der Themen weiterhin breit gefächert sein wird.
Der Fokus auf Architekturen, Compiler-Optimierungen und neue Einsatzgebiete von FPGAs bleibt Beweggrund für Innovationen. Zudem wird die Bedeutung von spezifischen Anwendungen, wie das maschinelle Lernen, Kryptografie und Signalverarbeitung, mit neuartigen FPGA-Designs weiter zunehmen. Die Fähigkeit, Hardware in einer zunehmend heterogenen Rechenwelt flexibel anpassen zu können, bleibt eine Schlüsselkompetenz. Diese Fähigkeit wird besonders im Kontext von Einschränkungen beim technologischen Fortschritt, wie sie durch das Auslaufen von Moores Gesetz gekennzeichnet sind, an Bedeutung gewinnen. Im kommenden Jahr wird die FCCM in Atlanta stattfinden, organisiert von Callie Hao und ihrem Team.