3.8.2023

KI-Trends: Juli

Zu den KI-Fortschritten in der diesmonatigen Ausgabe gehören die Zusammenarbeit von OpenAI in der Nachrichtenredaktion mit AP, das innovative Text-zu-Bild-Tool CM3leon von Meta, die Sicherheitsversprechen der Branchenriesen für KI, die Tests mit Googles medizinischem Tool Med-PaLM 2 sowie globale Diskussionen über die Regulierung und den Aufstieg der KI der Superintelligenz.

Cedric May

Chief Technology Officer

Trends

Künstliche Intelligenz (KI) hat in den letzten Jahren beeindruckende Fortschritte gemacht. Im Juli 2023 wurden bemerkenswerte Fortschritte angekündigt, darunter die Art und Weise, wie KI mit dem medizinischen Sektor verflochten ist, Geschäftspartnerschaften aufbaut, die Nachrichtenbranche beeinflusst und die Zukunft der Computergrafik gestaltet.

Für regelmäßige Updates vergessen Sie nicht, unseren wöchentlichen Newsletter auf LinkedIn zu abonnieren. Viel Spaß beim Lesen und tauchen wir ein in die faszinierende Welt der KI.

In dieser Ausgabe erfährst du:

  • Die bahnbrechende Partnerschaft zwischen OpenAI und AP: Diese Zusammenarbeit ist eine Verschmelzung von KI und Journalismus und zielt darauf ab, den Goldstandard für die Integration von KI in Nachrichtenredaktionen zu setzen und sowohl die damit verbundenen Herausforderungen als auch Chancen anzugehen.
  • CM3leon von Meta revolutioniert die Text-zu-Bild-Generierung: Als Symbol für den Fortschritt in der generativen KI demonstriert CM3leon Metas Engagement für die Weiterentwicklung multimodaler Fähigkeiten in KI-Modellen.
  • Die KI-Sicherheitsverpflichtungen der Big Eight: Unter der Leitung von Giganten wie Google, Microsoft und OpenAI geht dieses Versprechen auf die dringende Notwendigkeit einer verantwortungsvollen KI-Nutzung ein und markiert einen bedeutenden Schritt in Richtung Selbstregulierung in der Branche.
  • Der proaktive Ansatz von OpenAI zur Superintelligenz: Während der Beginn der Superintelligenz näher rückt, verstärkt OpenAI seine Bemühungen, die Fähigkeiten der KI mit den besten Interessen der Menschheit in Einklang zu bringen.

Von Pixeln zu Patienten: Die KI-Welle breitet sich über verschiedene Sphären aus!

Googles Med-PaLM 2 nimmt an den Mayo Clinic Trials teil

Laut einem Bericht des Wall Street Journal wird Googles Med-PaLM 2, ein KI-Tool zur Beantwortung medizinischer Fragen, seit April im Forschungskrankenhaus Mayo Clinic und an anderen Standorten getestet. Med-PaLM 2 ist eine aktualisierte Version von PaLM 2, die auf der Google I/O im Mai 2023 angekündigt wurde und vermutlich für Gespräche im Gesundheitswesen nützlicher ist als andere Chatbots. Obwohl es einige Ungenauigkeiten gibt, schneidet Med-PaLM 2 bei den meisten Metriken gut ab und Kunden, die das Tool testen, haben die Kontrolle über ihre Daten. Laut Greg Corrado, Senior Research Director bei Google, befindet sich Med-PaLM 2 noch in einem frühen Stadium, hat aber das Potenzial, die Einsatzmöglichkeiten von KI im Gesundheitswesen um das Zehnfache zu erweitern.

KPMG und Microsoft machen Fortschritte: Eine 2-Milliarden-Dollar-Wette auf KI und Cloud-Technologie

KPMG hat einen zuversichtlichen Plan angekündigt, in den nächsten fünf Jahren in Zusammenarbeit mit Microsoft unglaubliche 2 Milliarden US-Dollar in künstliche Intelligenz (KI) und Cloud-Dienste zu investieren. Auf diese Weise soll die Partnerschaft einen Umsatz von über 12 Milliarden US-Dollar generieren. Diese bedeutende Investition wird es KPMG ermöglichen, Aspekte seiner Steuer-, Prüfungs- und Beratungsdienstleistungen weiter zu automatisieren. Das Unternehmen wird in der Lage sein, noch schnellere Analysen bereitzustellen, mehr Zeit für strategische Beratung aufzuwenden und mehr Unternehmen bei der Integration von KI in ihre Abläufe zu unterstützen. Ein erheblicher Teil der Investitionen wird in die generative KI fließen, die Kosten senken und neue Effizienzsteigerungen ermöglichen kann. Durch den Einsatz dieser Technologie wird KPMG seine Arbeit in Bezug auf Umwelt-, Sozial- und Governance-Themen stärken. Darüber hinaus erhält KPMG frühzeitig Zugriff auf einen KI-Assistenten namens Microsoft 365 Copilot. Es ist erwähnenswert, dass auch andere Big-Four-Unternehmen Milliarden von Dollar in cloudbasierte und andere Technologien investiert haben, um ihre Wirtschaftsprüfungs-, Beratungs- und Steuergeschäfte mit den KI-Angeboten von Microsoft zu stärken.

OpenAI und AP bündeln ihre Kräfte: Eine bahnbrechende Partnerschaft in den Bereichen Nachrichten und KI

Associated Press hat mit OpenAI, der Muttergesellschaft von ChatGPT, einen Zweijahresvertrag über die gemeinsame Nutzung ausgewählter Nachrichteninhalte und -technologien abgeschlossen. Der Deal ist eine der ersten offiziellen Vereinbarungen zum Nachrichtenaustausch zwischen einem großen US-amerikanischen Nachrichtenunternehmen und einem KI-Unternehmen. OpenAI wird einen Teil des Textarchivs der AP aus dem Jahr 1985 lizenzieren, um das Training seiner KI-Algorithmen zu unterstützen. Im Gegenzug erhält der AP Zugang zur Technologie- und Produktexpertise von OpenAI. Die beiden Firmen arbeiten noch an den technischen Details, wie die gemeinsame Nutzung im Backend funktionieren soll. Die Partnerschaft mit OpenAI soll der AP dabei helfen, verantwortungsvolle Anwendungsfälle für generative KI in Nachrichtenprodukten und -diensten in der Zukunft zu verstehen. Die Nachrichtenbranche beschäftigt sich mit Möglichkeiten, KI optimal zu nutzen, um die Produktion zu verbessern. Die AP hofft, ein Branchenführer bei der Entwicklung von Standards und Best Practices rund um generative KI für andere Nachrichtenredaktionen zu sein.

Das große Ergebnis von Playground: 40 Millionen US-Dollar zur Revolutionierung der Computergrafik

Playground hat erfolgreich 40,8 Millionen US-Dollar gesammelt, um Innovationen in der Computergrafik voranzutreiben und intelligente Modelle zu entwickeln. Ihr selbstbewusster Plan besteht darin, mit der Bildverarbeitung zu beginnen, mit dem Ziel, modernste Fähigkeiten zu erreichen und Einzelpersonen in die Lage zu versetzen, über ihre bisherigen Grenzen hinaus kreativ zu sein . Der Plan umfasst die Entwicklung eines modernen Grafikeditors, die Förderung der Forschung im Bereich Computer Vision, die Konstruktion von Multitask-Modellen und die Ermöglichung einer exponentiellen Steigerung der Zahl der schöpferischen Personen.

© ️Spielplatz

CM3Leon von Meta: Der neue Standard in der Text-zu-Bild-Generierung?

Das Interesse und die Forschung an generativen KI-Modellen haben in letzter Zeit aufgrund der Fortschritte in der Verarbeitung natürlicher Sprache und der Bilderzeugung zugenommen. Meta demonstriert CM3leon, ein Single-Foundation-Modell, das sowohl Text als auch Bilder generieren kann.

CM3leon ist das erste multimodale Modell, das mit einem Rezept trainiert wird, das sich an Nur-Text-Sprachmodelle anpasst. Dieses Rezept ist einfach und ergibt ein starkes Modell. CM3leon kann Text- und Bildsequenzen generieren, die von beliebigen Sequenzen anderer Bild- und Textinhalte abhängig sind. Dies erweitert frühere Modelle, die entweder nur Text-zu-Bild oder nur Bild-zu-Text nutzten.

Demonstration of Meta's CM3leon.
© ️https://ai.meta.com

CM3leon ist ein groß angelegtes Multitasking-Modell, das die Leistung bei der Bild- und Textgenerierung verbessert. Es bietet gute Ergebnisse bei der Generierung von Bildunterschriften, der visuellen Beantwortung von Fragen, der textbasierten Bearbeitung und der bedingten Bildgenerierung. Im Vergleich zu Googles Parti erreicht CM3leon beim Zero-Shot-MS-COCO-Benchmark einen FID-Score von 4,88 und ist damit der neue Stand der Technik in der Text-zu-Bild-Generierung. CM3leon zeichnet sich auch durch die Generierung komplexer Kompositionsobjekte aus und eignet sich gut für visuelle Sprachaufgaben wie die Beantwortung visueller Fragen und die Erstellung von Untertiteln in Langform.

CM3leon ist in der Lage, textgesteuerte Bilderzeugung und -bearbeitung, Text-zu-Bild, Textaufgaben, strukturgesteuerte Bildbearbeitung, Objekt-zu-Bild und Segmentierung-zu-Bild zu ermöglichen. Seine reine Decoder-Transformator-Architektur wird mithilfe eines lizenzierten Datensatzes trainiert.

Da generative KI-Modelle wie CM3leon immer ausgefeilter werden, ist es wichtig, etwaige Verzerrungen in den Trainingsdaten transparent zu machen. Auf diese Weise können wir genauere und gerechtere Modelle für alle schaffen.

Die Gratwanderung der KI: Bewältigung globaler Regulierung, demokratischer Bedrohungen und der Beginn der Superintelligenz.

China bremst generative KI: Neue Regeln enthüllt

China hat vorläufige Regeln zur Regelung generativer KI-Dienste für in China ansässige Benutzer bekannt gegeben. Die Regeln zielen darauf ab, ein Gleichgewicht zwischen Entwicklung und Sicherheit herzustellen, indem sie die Einhaltung sozialistischer Grundwerte fordern und alles verbieten, von Pornografie und Terrorismus bis hin zu Rassismus und Inhalten, die die nationale Sicherheit Chinas bedrohen. Algorithmen, die die öffentliche Meinung beeinflussen können, müssen registriert werden und Anbieter müssen eine Verwaltungslizenz einholen. Algorithmen dürfen nicht aufgrund von Faktoren wie ethnischer Zugehörigkeit, Geschlecht, Alter, Beruf oder Gesundheit diskriminierend sein. Dienstanbieter müssen den generativen Prozess für illegale Inhalte identifizieren und stoppen, und Regulierungsbehörden haben das Recht, die Besonderheiten eines generativen KI-Modells zu kennen. Schließlich fordert China eigenständige Innovationen im Bereich der KI und fördert gleichzeitig die internationale Zusammenarbeit.

The Big Eight: Das gemeinsame Engagement von KI-Unternehmen für Wasserzeichen und mehr

Mehrere große generative KI-Unternehmen mit Sitz in den USA werden ihre Inhalte mit Wasserzeichen kennzeichnen. Laut einem am 21. Juli veröffentlichten Faktenblatt des Weißen Hauses haben Amazon, Anthropic, Google, Inflection, Meta, Microsoft und OpenAI acht freiwillige Verpflichtungen im Zusammenhang mit der Überwachung und Nutzung generativer KI, einschließlich Wasserzeichen, eingegangen. Die Vereinbarung folgt eine Erklärung des Weißen Hauses im März über Bedenken hinsichtlich des Missbrauchs von KI. Dies geschieht auch zu einer Zeit, in der die Regulierungsbehörden Verfahren zur Bewältigung der Auswirkungen generativer KI auf Technologie und Menschen festlegen, seit ChatGPT im November 2022 KI-Inhalte in den Fokus der Öffentlichkeit gerückt hat.

Zu den acht KI-Sicherheitsverpflichtungen gehören:

  • Interne und externe Sicherheitstests von KI-Systemen
  • Austausch von Informationen zum Umgang mit KI-Risiken
  • Investitionen in Cybersicherheit und Schutz vor Insiderbedrohungen
  • Förderung der Entdeckung und Meldung von Sicherheitslücken durch Dritte
  • Öffentliche Berichterstattung über die Fähigkeiten und Grenzen von KI-Systemen
  • Priorisierung der Forschung zu Vorurteilen und Datenschutz
  • Einsatz von KI für nützliche Zwecke
  • Entwicklung technischer Mechanismen für Wasserzeichen

Das Wasserzeichen-Engagement umfasst die Entwicklung einer Möglichkeit, Text-, Audio- oder visuelle Inhalte als maschinengeneriert zu kennzeichnen. Es gilt für alle öffentlich zugänglichen generativen KI-Inhalte, die erstellt werden, nachdem das Wasserzeichensystem gesperrt wurde. Moe Tanabian, ehemaliger Global Vice President von Microsoft Azure und derzeitiger Chief Product Officer von Cognite, unterstützt die staatliche Regulierung generativer KI, da es Möglichkeiten für böswillige Akteure gibt, diese auszunutzen der generativen KI. Er verglich die aktuelle Ära der generativen KI mit dem Aufstieg der sozialen Medien, einschließlich möglicher Nachteile wie dem Datenschutzskandal von Cambridge Analytica und anderen Fehlinformationen während der Wahl 2016.

Soros über KI: Ein verheerender Schlag für Demokratien und Hilfe für Autoritäre

Der bekannte Milliardär und Finanzier George Soros warnt selbstbewusst vor der großen Gefahr, die künstliche Intelligenz für Demokratien darstellt, und vor ihrem Potenzial, eine Macht zu werden Ul-Tool für Autoritäre. Soros erkennt an, dass K.I. hat das Potenzial, geschlossenen Gesellschaften die Überwachung ihrer Bürger zu ermöglichen. Er betont außerdem, dass die globalen Vorschriften für K.I. sind aufgrund des Konflikts zwischen offenen und geschlossenen Gesellschaften unerreichbar. Obwohl Soros instinktiv gegen KI ist, gibt er zu, dass er nicht weiß, wie er sie stoppen kann. Obwohl Experten eine Regulierung der KI fordern, ist Soros fest davon überzeugt, dass Vorschriften weltweit durchsetzbar sein müssen. In den kommenden Monaten werden die Open Society Foundations von Soros mindestens 40 % ihres Personals abbauen. Soros glaubt, dass K.I. wird bei den US-Wahlen im nächsten Jahr eine entscheidende Rolle spielen und, wenn er nicht kontrolliert wird, zweifellos eine erhebliche Bedrohung darstellen.

Portrait of billionaire financier George Soros.
© ️Fortune.com

Superintelligenz nutzen: OpenAis Roadmap zur KI-Ausrichtung

Superintelligenz ist eine mächtige Technologie, die große globale Probleme lösen könnte, aber sie birgt auch ein hohes Risiko, die Menschheit zu entmachten oder sogar zu zerstören. OpenAI ergreift proaktive Maßnahmen, um sich auf seine Ankunft innerhalb eines Jahrzehnts vorzubereiten, einschließlich der Entwicklung neuer Governance-Institutionen und der Lösung des Problems der Ausrichtung der Superintelligenz. Sie widmen in den nächsten vier Jahren 20 % ihrer Rechenleistung der Lösung dieses Problems und stellen ein Team aus Spitzenforschern und Ingenieuren zusammen, um daran zu arbeiten. Ihre Arbeit ergänzt die bestehenden Bemühungen von OpenAI zur Verbesserung der KI-Sicherheit.

Die Zukunft digitaler Dialoge: Das Versprechen von Claude 2 und die erweiterte Reichweite von Bing.

Ein neuer Spieler im Bereich KI-Chatbots: Lernen Sie Claude 2 von Anthropic kennen

Der KI-Chatbot von Anthropic, Claude 2, steht jetzt für öffentliche Tests in den USA und im Vereinigten Königreich zur Verfügung. Claude 2 hat einen gesprächigen Ton und kann Aufgaben wie das Erstellen von Zusammenfassungen, Codieren und Übersetzen ausführen. Sie orientiert sich an einer Reihe von Grundsätzen, die als „Verfassung“ bezeichnet werden, um ihre Antworten selbst zu überarbeiten. Claude 2 ist eine Verbesserung gegenüber dem Vorgängermodell und verfügt über bessere Mathematik-, Programmier- und Denkfähigkeiten. Darüber hinaus verfügt es über ein größeres Kontextfenster von etwa 75.000 Wörtern und erzeugt weniger wahrscheinlich schädliche Inhalte. Obwohl es auf Daten bis Dezember 2022 beschränkt ist, können dennoch Anfragen zu kürzlich veröffentlichten Webseiten beantwortet werden.

Der große Schritt von Bing Chat: Microsofts KI-Chatbot wird browserübergreifend

Der KI-Chatbot von Microsoft, Bing Chat, wird jetzt in Nicht-Microsoft-Browsern verfügbar sein, darunter Google Chrome und Apples Safari. Dadurch erhalten Benutzer außerhalb von Microsoft-Produkten, wie der mobilen Bing-App und dem Microsoft Edge-Browser, Zugriff auf den ChatGPT-ähnlichen KI-Chatbot. Microsoft hat die Erweiterung bestätigt, aber noch nicht bekannt gegeben, welche anderen Browser unterstützt werden. Bing Chat basiert auf dem GPT-4-Modell von OpenAI und scheint ein natives dunkles Thema zu testen. Die Erfahrung in anderen Browsern weist jedoch einige Einschränkungen auf, darunter die Unterstützung von nur fünf Nachrichten pro Konversation in Chrome statt der 30, die in Microsoft Edge verfügbar sind, und die Begrenzung der Zeichenanzahl auf 2.000 statt der von Edge unterstützten 3.000. Bing Chat wurde in Skype integriert und hat sogar eine Version für den Unternehmensgebrauch herausgebracht, die geschäftsorientierte Datenschutz- und Governance-Kontrollen umfasst.

Screenshot of Microsoft's AI chatbot Bing Chat.
© ️https://techcrunch.com

Vielen Dank, dass Sie bei der Juli-Ausgabe von Frontnow – Trends in AI dabei waren! In dieser Ausgabe haben wir die vielfältige Landschaft der künstlichen Intelligenz erkundet, von Googles Spitzenarbeit im Bereich der KI im Gesundheitswesen über Chinas Regulierungsbemühungen bis hin zu George Soros‘ Bedenken hinsichtlich der gesellschaftlichen Auswirkungen von KI. Wenn wir auf den August blicken, lassen Sie uns weiterhin auf Störungen eingehen. Wir laden Sie ein, nächsten Monat wieder dabei zu sein, während wir die Welt der KI weiter erkunden.

Künstliche Intelligenz (KI) hat in den letzten Jahren beeindruckende Fortschritte gemacht. Im Juli 2023 wurden bemerkenswerte Fortschritte angekündigt, darunter die Art und Weise, wie KI mit dem medizinischen Sektor verflochten ist, Geschäftspartnerschaften aufbaut, die Nachrichtenbranche beeinflusst und die Zukunft der Computergrafik gestaltet.

Für regelmäßige Updates vergessen Sie nicht, unseren wöchentlichen Newsletter auf LinkedIn zu abonnieren. Viel Spaß beim Lesen und tauchen wir ein in die faszinierende Welt der KI.

In dieser Ausgabe erfährst du:

  • Die bahnbrechende Partnerschaft zwischen OpenAI und AP: Diese Zusammenarbeit ist eine Verschmelzung von KI und Journalismus und zielt darauf ab, den Goldstandard für die Integration von KI in Nachrichtenredaktionen zu setzen und sowohl die damit verbundenen Herausforderungen als auch Chancen anzugehen.
  • CM3leon von Meta revolutioniert die Text-zu-Bild-Generierung: Als Symbol für den Fortschritt in der generativen KI demonstriert CM3leon Metas Engagement für die Weiterentwicklung multimodaler Fähigkeiten in KI-Modellen.
  • Die KI-Sicherheitsverpflichtungen der Big Eight: Unter der Leitung von Giganten wie Google, Microsoft und OpenAI geht dieses Versprechen auf die dringende Notwendigkeit einer verantwortungsvollen KI-Nutzung ein und markiert einen bedeutenden Schritt in Richtung Selbstregulierung in der Branche.
  • Der proaktive Ansatz von OpenAI zur Superintelligenz: Während der Beginn der Superintelligenz näher rückt, verstärkt OpenAI seine Bemühungen, die Fähigkeiten der KI mit den besten Interessen der Menschheit in Einklang zu bringen.

Von Pixeln zu Patienten: Die KI-Welle breitet sich über verschiedene Sphären aus!

Googles Med-PaLM 2 nimmt an den Mayo Clinic Trials teil

Laut einem Bericht des Wall Street Journal wird Googles Med-PaLM 2, ein KI-Tool zur Beantwortung medizinischer Fragen, seit April im Forschungskrankenhaus Mayo Clinic und an anderen Standorten getestet. Med-PaLM 2 ist eine aktualisierte Version von PaLM 2, die auf der Google I/O im Mai 2023 angekündigt wurde und vermutlich für Gespräche im Gesundheitswesen nützlicher ist als andere Chatbots. Obwohl es einige Ungenauigkeiten gibt, schneidet Med-PaLM 2 bei den meisten Metriken gut ab und Kunden, die das Tool testen, haben die Kontrolle über ihre Daten. Laut Greg Corrado, Senior Research Director bei Google, befindet sich Med-PaLM 2 noch in einem frühen Stadium, hat aber das Potenzial, die Einsatzmöglichkeiten von KI im Gesundheitswesen um das Zehnfache zu erweitern.

KPMG und Microsoft machen Fortschritte: Eine 2-Milliarden-Dollar-Wette auf KI und Cloud-Technologie

KPMG hat einen zuversichtlichen Plan angekündigt, in den nächsten fünf Jahren in Zusammenarbeit mit Microsoft unglaubliche 2 Milliarden US-Dollar in künstliche Intelligenz (KI) und Cloud-Dienste zu investieren. Auf diese Weise soll die Partnerschaft einen Umsatz von über 12 Milliarden US-Dollar generieren. Diese bedeutende Investition wird es KPMG ermöglichen, Aspekte seiner Steuer-, Prüfungs- und Beratungsdienstleistungen weiter zu automatisieren. Das Unternehmen wird in der Lage sein, noch schnellere Analysen bereitzustellen, mehr Zeit für strategische Beratung aufzuwenden und mehr Unternehmen bei der Integration von KI in ihre Abläufe zu unterstützen. Ein erheblicher Teil der Investitionen wird in die generative KI fließen, die Kosten senken und neue Effizienzsteigerungen ermöglichen kann. Durch den Einsatz dieser Technologie wird KPMG seine Arbeit in Bezug auf Umwelt-, Sozial- und Governance-Themen stärken. Darüber hinaus erhält KPMG frühzeitig Zugriff auf einen KI-Assistenten namens Microsoft 365 Copilot. Es ist erwähnenswert, dass auch andere Big-Four-Unternehmen Milliarden von Dollar in cloudbasierte und andere Technologien investiert haben, um ihre Wirtschaftsprüfungs-, Beratungs- und Steuergeschäfte mit den KI-Angeboten von Microsoft zu stärken.

OpenAI und AP bündeln ihre Kräfte: Eine bahnbrechende Partnerschaft in den Bereichen Nachrichten und KI

Associated Press hat mit OpenAI, der Muttergesellschaft von ChatGPT, einen Zweijahresvertrag über die gemeinsame Nutzung ausgewählter Nachrichteninhalte und -technologien abgeschlossen. Der Deal ist eine der ersten offiziellen Vereinbarungen zum Nachrichtenaustausch zwischen einem großen US-amerikanischen Nachrichtenunternehmen und einem KI-Unternehmen. OpenAI wird einen Teil des Textarchivs der AP aus dem Jahr 1985 lizenzieren, um das Training seiner KI-Algorithmen zu unterstützen. Im Gegenzug erhält der AP Zugang zur Technologie- und Produktexpertise von OpenAI. Die beiden Firmen arbeiten noch an den technischen Details, wie die gemeinsame Nutzung im Backend funktionieren soll. Die Partnerschaft mit OpenAI soll der AP dabei helfen, verantwortungsvolle Anwendungsfälle für generative KI in Nachrichtenprodukten und -diensten in der Zukunft zu verstehen. Die Nachrichtenbranche beschäftigt sich mit Möglichkeiten, KI optimal zu nutzen, um die Produktion zu verbessern. Die AP hofft, ein Branchenführer bei der Entwicklung von Standards und Best Practices rund um generative KI für andere Nachrichtenredaktionen zu sein.

Das große Ergebnis von Playground: 40 Millionen US-Dollar zur Revolutionierung der Computergrafik

Playground hat erfolgreich 40,8 Millionen US-Dollar gesammelt, um Innovationen in der Computergrafik voranzutreiben und intelligente Modelle zu entwickeln. Ihr selbstbewusster Plan besteht darin, mit der Bildverarbeitung zu beginnen, mit dem Ziel, modernste Fähigkeiten zu erreichen und Einzelpersonen in die Lage zu versetzen, über ihre bisherigen Grenzen hinaus kreativ zu sein . Der Plan umfasst die Entwicklung eines modernen Grafikeditors, die Förderung der Forschung im Bereich Computer Vision, die Konstruktion von Multitask-Modellen und die Ermöglichung einer exponentiellen Steigerung der Zahl der schöpferischen Personen.

© ️Spielplatz

CM3Leon von Meta: Der neue Standard in der Text-zu-Bild-Generierung?

Das Interesse und die Forschung an generativen KI-Modellen haben in letzter Zeit aufgrund der Fortschritte in der Verarbeitung natürlicher Sprache und der Bilderzeugung zugenommen. Meta demonstriert CM3leon, ein Single-Foundation-Modell, das sowohl Text als auch Bilder generieren kann.

CM3leon ist das erste multimodale Modell, das mit einem Rezept trainiert wird, das sich an Nur-Text-Sprachmodelle anpasst. Dieses Rezept ist einfach und ergibt ein starkes Modell. CM3leon kann Text- und Bildsequenzen generieren, die von beliebigen Sequenzen anderer Bild- und Textinhalte abhängig sind. Dies erweitert frühere Modelle, die entweder nur Text-zu-Bild oder nur Bild-zu-Text nutzten.

Demonstration of Meta's CM3leon.
© ️https://ai.meta.com

CM3leon ist ein groß angelegtes Multitasking-Modell, das die Leistung bei der Bild- und Textgenerierung verbessert. Es bietet gute Ergebnisse bei der Generierung von Bildunterschriften, der visuellen Beantwortung von Fragen, der textbasierten Bearbeitung und der bedingten Bildgenerierung. Im Vergleich zu Googles Parti erreicht CM3leon beim Zero-Shot-MS-COCO-Benchmark einen FID-Score von 4,88 und ist damit der neue Stand der Technik in der Text-zu-Bild-Generierung. CM3leon zeichnet sich auch durch die Generierung komplexer Kompositionsobjekte aus und eignet sich gut für visuelle Sprachaufgaben wie die Beantwortung visueller Fragen und die Erstellung von Untertiteln in Langform.

CM3leon ist in der Lage, textgesteuerte Bilderzeugung und -bearbeitung, Text-zu-Bild, Textaufgaben, strukturgesteuerte Bildbearbeitung, Objekt-zu-Bild und Segmentierung-zu-Bild zu ermöglichen. Seine reine Decoder-Transformator-Architektur wird mithilfe eines lizenzierten Datensatzes trainiert.

Da generative KI-Modelle wie CM3leon immer ausgefeilter werden, ist es wichtig, etwaige Verzerrungen in den Trainingsdaten transparent zu machen. Auf diese Weise können wir genauere und gerechtere Modelle für alle schaffen.

Die Gratwanderung der KI: Bewältigung globaler Regulierung, demokratischer Bedrohungen und der Beginn der Superintelligenz.

China bremst generative KI: Neue Regeln enthüllt

China hat vorläufige Regeln zur Regelung generativer KI-Dienste für in China ansässige Benutzer bekannt gegeben. Die Regeln zielen darauf ab, ein Gleichgewicht zwischen Entwicklung und Sicherheit herzustellen, indem sie die Einhaltung sozialistischer Grundwerte fordern und alles verbieten, von Pornografie und Terrorismus bis hin zu Rassismus und Inhalten, die die nationale Sicherheit Chinas bedrohen. Algorithmen, die die öffentliche Meinung beeinflussen können, müssen registriert werden und Anbieter müssen eine Verwaltungslizenz einholen. Algorithmen dürfen nicht aufgrund von Faktoren wie ethnischer Zugehörigkeit, Geschlecht, Alter, Beruf oder Gesundheit diskriminierend sein. Dienstanbieter müssen den generativen Prozess für illegale Inhalte identifizieren und stoppen, und Regulierungsbehörden haben das Recht, die Besonderheiten eines generativen KI-Modells zu kennen. Schließlich fordert China eigenständige Innovationen im Bereich der KI und fördert gleichzeitig die internationale Zusammenarbeit.

The Big Eight: Das gemeinsame Engagement von KI-Unternehmen für Wasserzeichen und mehr

Mehrere große generative KI-Unternehmen mit Sitz in den USA werden ihre Inhalte mit Wasserzeichen kennzeichnen. Laut einem am 21. Juli veröffentlichten Faktenblatt des Weißen Hauses haben Amazon, Anthropic, Google, Inflection, Meta, Microsoft und OpenAI acht freiwillige Verpflichtungen im Zusammenhang mit der Überwachung und Nutzung generativer KI, einschließlich Wasserzeichen, eingegangen. Die Vereinbarung folgt eine Erklärung des Weißen Hauses im März über Bedenken hinsichtlich des Missbrauchs von KI. Dies geschieht auch zu einer Zeit, in der die Regulierungsbehörden Verfahren zur Bewältigung der Auswirkungen generativer KI auf Technologie und Menschen festlegen, seit ChatGPT im November 2022 KI-Inhalte in den Fokus der Öffentlichkeit gerückt hat.

Zu den acht KI-Sicherheitsverpflichtungen gehören:

  • Interne und externe Sicherheitstests von KI-Systemen
  • Austausch von Informationen zum Umgang mit KI-Risiken
  • Investitionen in Cybersicherheit und Schutz vor Insiderbedrohungen
  • Förderung der Entdeckung und Meldung von Sicherheitslücken durch Dritte
  • Öffentliche Berichterstattung über die Fähigkeiten und Grenzen von KI-Systemen
  • Priorisierung der Forschung zu Vorurteilen und Datenschutz
  • Einsatz von KI für nützliche Zwecke
  • Entwicklung technischer Mechanismen für Wasserzeichen

Das Wasserzeichen-Engagement umfasst die Entwicklung einer Möglichkeit, Text-, Audio- oder visuelle Inhalte als maschinengeneriert zu kennzeichnen. Es gilt für alle öffentlich zugänglichen generativen KI-Inhalte, die erstellt werden, nachdem das Wasserzeichensystem gesperrt wurde. Moe Tanabian, ehemaliger Global Vice President von Microsoft Azure und derzeitiger Chief Product Officer von Cognite, unterstützt die staatliche Regulierung generativer KI, da es Möglichkeiten für böswillige Akteure gibt, diese auszunutzen der generativen KI. Er verglich die aktuelle Ära der generativen KI mit dem Aufstieg der sozialen Medien, einschließlich möglicher Nachteile wie dem Datenschutzskandal von Cambridge Analytica und anderen Fehlinformationen während der Wahl 2016.

Soros über KI: Ein verheerender Schlag für Demokratien und Hilfe für Autoritäre

Der bekannte Milliardär und Finanzier George Soros warnt selbstbewusst vor der großen Gefahr, die künstliche Intelligenz für Demokratien darstellt, und vor ihrem Potenzial, eine Macht zu werden Ul-Tool für Autoritäre. Soros erkennt an, dass K.I. hat das Potenzial, geschlossenen Gesellschaften die Überwachung ihrer Bürger zu ermöglichen. Er betont außerdem, dass die globalen Vorschriften für K.I. sind aufgrund des Konflikts zwischen offenen und geschlossenen Gesellschaften unerreichbar. Obwohl Soros instinktiv gegen KI ist, gibt er zu, dass er nicht weiß, wie er sie stoppen kann. Obwohl Experten eine Regulierung der KI fordern, ist Soros fest davon überzeugt, dass Vorschriften weltweit durchsetzbar sein müssen. In den kommenden Monaten werden die Open Society Foundations von Soros mindestens 40 % ihres Personals abbauen. Soros glaubt, dass K.I. wird bei den US-Wahlen im nächsten Jahr eine entscheidende Rolle spielen und, wenn er nicht kontrolliert wird, zweifellos eine erhebliche Bedrohung darstellen.

Portrait of billionaire financier George Soros.
© ️Fortune.com

Superintelligenz nutzen: OpenAis Roadmap zur KI-Ausrichtung

Superintelligenz ist eine mächtige Technologie, die große globale Probleme lösen könnte, aber sie birgt auch ein hohes Risiko, die Menschheit zu entmachten oder sogar zu zerstören. OpenAI ergreift proaktive Maßnahmen, um sich auf seine Ankunft innerhalb eines Jahrzehnts vorzubereiten, einschließlich der Entwicklung neuer Governance-Institutionen und der Lösung des Problems der Ausrichtung der Superintelligenz. Sie widmen in den nächsten vier Jahren 20 % ihrer Rechenleistung der Lösung dieses Problems und stellen ein Team aus Spitzenforschern und Ingenieuren zusammen, um daran zu arbeiten. Ihre Arbeit ergänzt die bestehenden Bemühungen von OpenAI zur Verbesserung der KI-Sicherheit.

Die Zukunft digitaler Dialoge: Das Versprechen von Claude 2 und die erweiterte Reichweite von Bing.

Ein neuer Spieler im Bereich KI-Chatbots: Lernen Sie Claude 2 von Anthropic kennen

Der KI-Chatbot von Anthropic, Claude 2, steht jetzt für öffentliche Tests in den USA und im Vereinigten Königreich zur Verfügung. Claude 2 hat einen gesprächigen Ton und kann Aufgaben wie das Erstellen von Zusammenfassungen, Codieren und Übersetzen ausführen. Sie orientiert sich an einer Reihe von Grundsätzen, die als „Verfassung“ bezeichnet werden, um ihre Antworten selbst zu überarbeiten. Claude 2 ist eine Verbesserung gegenüber dem Vorgängermodell und verfügt über bessere Mathematik-, Programmier- und Denkfähigkeiten. Darüber hinaus verfügt es über ein größeres Kontextfenster von etwa 75.000 Wörtern und erzeugt weniger wahrscheinlich schädliche Inhalte. Obwohl es auf Daten bis Dezember 2022 beschränkt ist, können dennoch Anfragen zu kürzlich veröffentlichten Webseiten beantwortet werden.

Der große Schritt von Bing Chat: Microsofts KI-Chatbot wird browserübergreifend

Der KI-Chatbot von Microsoft, Bing Chat, wird jetzt in Nicht-Microsoft-Browsern verfügbar sein, darunter Google Chrome und Apples Safari. Dadurch erhalten Benutzer außerhalb von Microsoft-Produkten, wie der mobilen Bing-App und dem Microsoft Edge-Browser, Zugriff auf den ChatGPT-ähnlichen KI-Chatbot. Microsoft hat die Erweiterung bestätigt, aber noch nicht bekannt gegeben, welche anderen Browser unterstützt werden. Bing Chat basiert auf dem GPT-4-Modell von OpenAI und scheint ein natives dunkles Thema zu testen. Die Erfahrung in anderen Browsern weist jedoch einige Einschränkungen auf, darunter die Unterstützung von nur fünf Nachrichten pro Konversation in Chrome statt der 30, die in Microsoft Edge verfügbar sind, und die Begrenzung der Zeichenanzahl auf 2.000 statt der von Edge unterstützten 3.000. Bing Chat wurde in Skype integriert und hat sogar eine Version für den Unternehmensgebrauch herausgebracht, die geschäftsorientierte Datenschutz- und Governance-Kontrollen umfasst.

Screenshot of Microsoft's AI chatbot Bing Chat.
© ️https://techcrunch.com

Vielen Dank, dass Sie bei der Juli-Ausgabe von Frontnow – Trends in AI dabei waren! In dieser Ausgabe haben wir die vielfältige Landschaft der künstlichen Intelligenz erkundet, von Googles Spitzenarbeit im Bereich der KI im Gesundheitswesen über Chinas Regulierungsbemühungen bis hin zu George Soros‘ Bedenken hinsichtlich der gesellschaftlichen Auswirkungen von KI. Wenn wir auf den August blicken, lassen Sie uns weiterhin auf Störungen eingehen. Wir laden Sie ein, nächsten Monat wieder dabei zu sein, während wir die Welt der KI weiter erkunden.

Read next

Frontnow Newsletter

Stay Updated With Frontnow's News & Cutting-Edge AI Innovation.