3 min read

Ein einjähriger Forschungsworkshop über große multilinguale Sprachmodelle und Datensätze

Ein einjähriger Forschungsworkshop über große multilinguale Sprachmodelle und Datensätze
Photo by Kvalifik / Unsplash

Wir sind Fan und zitieren:

Und stellen Ihnen das weltweit größte offene mehrsprachige Sprachmodell vor - BLOOM! Diese Plattform ermöglicht es Ihnen, Sprachen zu lernen und Ihre Sprachkenntnisse zu verbessern, ohne Ihren Browser zu verlassen.

Sie finden das Modell hier und erfahren mehr in unserem Blogbeitrag. Die künstliche Intelligenz nimmt rasant zu und hat das Potenzial, die Gesellschaft grundlegend zu verändern. Ein großer Teil dieser Bemühungen beruht auf dem Training größerer Modelle auf größeren Datensätzen, die sich hauptsächlich in den Händen großer Technologiegiganten befinden. Der Würgegriff, den diese Unternehmen auf diese transformative Technologie ausüben, wirft aus Sicht des Forschungsfortschritts, der Umwelt, der Ethik und der Gesellschaft einige Probleme auf.

Das BigScience-Projekt inspiriert sich an wissenschaftlichen Schöpfungsplänen wie dem CERN und dem LHC, bei denen es sich um offene wissenschaftliche Kollaborationen handelt, die die Schaffung von Artefakten in großem Maßstab erleichtern, die für die gesamte Forschungsgemeinschaft von Nutzen sind. Dieses Projekt könnte dazu beitragen, einige der Probleme zu lösen, die die Entwicklung künstlicher Intelligenz heute plagen.

Ein Jahr lang, von Mai 2021 bis Mai 2022, arbeiten mehr als 1.000 Forscher aus 60 Ländern und mehr als 250 Institutionen am Supercomputer Jean Zay (IDRIS) in der Nähe von Paris an einem sehr großen mehrsprachigen neuronalen Netzwerk-Sprachmodell und einem sehr großen mehrsprachigen Textdatensatz. Der Workshop wird es den Teilnehmern ermöglichen, die Daten und das Modell aus allen Blickwinkeln zu erforschen: Vorurteile, soziale Auswirkungen, Fähigkeiten, Grenzen, ethische Aspekte, mögliche Verbesserungen und spezifische Leistungen in einem bestimmten Bereich. All dieses Wissen wird auf Notion offen zugänglich sein.

Kommende Veranstaltungen BigScience organisiert den ACL 2022 Workshop "Challenges & Perspectives in Creating Large Language Models" im Mai 2022. Diese Veranstaltung wird auch als Abschlusssitzung dieser einjährigen Initiative dienen, deren Ziel die Entwicklung eines mehrsprachigen großen Sprachmodells ist. Weitere Informationen und das Programm finden Sie hier.

Wer organisiert BigScience? BigScience ist weder ein Konsortium noch eine offiziell gegründete Einrichtung. Es handelt sich um eine offene Zusammenarbeit, die von HuggingFace, GENCI und IDRIS ins Leben gerufen wurde und als Forschungsworkshop organisiert wird. Dieser Forschungsworkshop versammelt akademische, industrielle und unabhängige Forscher aus vielen Bereichen, deren Forschungsinteressen sich über viele Forschungsfelder erstrecken, darunter KI, NLP, Sozialwissenschaften, Recht, Ethik und öffentliche Politik. Obwohl es keine formale Beziehung zwischen den Mitgliedern der Teilnehmer des Workshops und der Arbeitsgruppe gibt, ist die BigScience-Initiative dankbar für die Freiheit, an dem Workshop teilzunehmen, die die akademischen und industriellen Institutionen, die hinter allen Teilnehmern stehen, gewährt haben. Insbesondere möchten wir uns für die Unterstützung bedanken, die wir von:‍‍

Join/follow Twitter: @BigScienceW Website home: https://bigscience.huggingface.co

Melden Sie sich für den Newsletter an Nehmen Sie am Workshop teil E-Mail: bigscience-contact@googlegroups.com

DISCLAIMER BigScience ist ein offenes Wissenschaftsprojekt, das aus Hunderten von Forschern auf der ganzen Welt besteht. Wir sind nicht unter einer zentralisierten juristischen Person strukturiert, und obwohl wir planen, in naher Zukunft eine juristische Person für die Datenverwaltung und die Zwecke der Gemeinschaft zu schaffen, wird unser Projekt derzeit einfach von unabhängigen Freiwilligen getragen. Unsere Webseite dient als Informationsplattform, auf der wir Materialien und Links anzeigen, die Eigentum von Unternehmen sind, mit denen wir zwar bestimmte Beziehungen, aber keine rechtlichen Beziehungen haben. Indem Sie auf die Materialien, die wir auf unserer Webseite anzeigen, zugreifen oder diese nutzen oder auf Links zu anderen Websites klicken, erklären Sie sich mit allen Bedingungen und/oder Richtlinien einverstanden, die mit diesen Materialien und anderen Websites verbunden sind. Wenn Sie mit einer dieser Bestimmungen nicht einverstanden sind, bitten wir Sie, die Materialien oder anderen Websites nicht zu nutzen.





Matthias Mut

Spielmacher, Teamsportler, KI-Enthusiast - Technik ist mein Ding. Spaß an Entwicklung, Fortschritt & Automatisierung.

srm@falktron.gmbh