Alexander Goeres 𒀯so was ist bestimmt sehr hilfreich bei der modernisierung unserer fax-basierten verwaltungsstrukturen hier im schlandle. ki für den einsatz trainieren:<br><br><blockquote>Zum einen kann eine Wächter-KI nützlich sein, um künstliche Intelligenzen beim „Belohnungs-Hacking“ durch betrügerische Abkürzungen zu ertappen. „Eine solches Chain-of-Thought-Monitoring könnte eine der wenigen effektiven Methoden sein, um KI-Modelle mit übermenschlichen Fähigkeiten zu überwachen“, konstatieren Baker und sein Team.<br><br>Allerdings eigne sich diese Kontrolle nicht dafür, schon im Training gegenzusteuern. „Wir raten KI-Entwicklern dringend davon ab, eine solche Supervision schon beim Training von fortgeschrittenen Reasoning-Modellen einzusetzen“, so die OpenAI-Forscher. Denn das würde nur dazu führen, dass die KI-Modelle lernen, die Überwachung auszutricksen. De facto wären wir dann blind und hätten keine Möglichkeit mehr, die künstlichen Intelligenzen zu kontrollieren. </blockquote><br>ich schätze mal, eine maßnahme der blackrock-koalition wird dann sein, ki schon mit überwachung durch wächter-ki zu trainieren, weil das macht man ja auch sonst so. und überhaupt, kontrolle ist besser ...<br><br>#<a class="" href="https://hub.netzgemeinde.eu/search?tag=computer" rel="nofollow noopener noreferrer" target="_blank">computer</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=ki" rel="nofollow noopener noreferrer" target="_blank">ki</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=verwaltung" rel="nofollow noopener noreferrer" target="_blank">verwaltung</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=modernisierung" rel="nofollow noopener noreferrer" target="_blank">modernisierung</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=cdsu" rel="nofollow noopener noreferrer" target="_blank">cdsu</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=fritzefrei" rel="nofollow noopener noreferrer" target="_blank">fritzefrei</a> #<a class="" href="https://hub.netzgemeinde.eu/search?tag=umfallerpartei" rel="nofollow noopener noreferrer" target="_blank">umfallerpartei</a><br><br> <a href="https://nrw.social/@scinexx" rel="nofollow noopener noreferrer" target="_blank"></a><span><a href="https://nrw.social/@scinexx" rel="nofollow noopener noreferrer" target="_blank">scinexx - das wissensmagazin</a> wrote the following <a href="https://nrw.social/@scinexx/114221597901409565" rel="nofollow noopener noreferrer" target="_blank">post</a> <span class="">Tue, 25 Mar 2025 07:14:28 +0100</span></span> Eine künstliche Intelligenz vom absichtlichen Schummeln und Lügen abzuhalten, ist schwieriger als erwartet, wie Forscher von OpenAI feststellen mussten. <a href="https://nrw.social/tags/OpenAI" rel="nofollow noopener noreferrer" target="_blank">#OpenAI</a> <a href="https://nrw.social/tags/KI" rel="nofollow noopener noreferrer" target="_blank">#KI</a> <a href="https://nrw.social/tags/kuenstlicheIntelligenz" rel="nofollow noopener noreferrer" target="_blank">#kuenstlicheIntelligenz</a> <a href="https://nrw.social/tags/AI" rel="nofollow noopener noreferrer" target="_blank">#AI</a> <a href="https://nrw.social/tags/Reasoning" rel="nofollow noopener noreferrer" target="_blank">#Reasoning</a> <br><a href="https://www.scinexx.de/news/technik/ist-betruegerische-ki-noch-kontrollierbar/" rel="nofollow noopener noreferrer" target="_blank">https://www.scinexx.de/news/technik/ist-betruegerische-ki-noch-kontrollierbar/</a>