{"id":6782,"date":"2024-04-17T09:10:40","date_gmt":"2024-04-17T09:10:40","guid":{"rendered":"https:\/\/byte-bucket.com\/2024\/04\/17\/ai-codiertool-gpt-4-turbo-enttaeuscht-bei-coding-benchmarks-aider-empfiehlt-alternativen\/"},"modified":"2024-04-17T09:10:40","modified_gmt":"2024-04-17T09:10:40","slug":"ai-codiertool-gpt-4-turbo-enttaeuscht-bei-coding-benchmarks-aider-empfiehlt-alternativen","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=6782","title":{"rendered":"AI-Codiertool GPT-4 Turbo entt\u00e4uscht bei Coding-Benchmarks: Aider empfiehlt Alternativen"},"content":{"rendered":"<p>Der neueste Bericht des KI-gest\u00fctzten Codiertool-Anbieters Aider hat einige interessante Erkenntnisse \u00fcber das brandneue GPT-4 Turbo mit Vision-Funktion zu Tage gef\u00f6rdert. Und leider sind es keine guten Neuigkeiten.<\/p>\n<p>Es scheint, als h\u00e4tte das neue Modell einige Schwierigkeiten mit der Codequalit\u00e4t. Die Analyse zeigt, dass im Vergleich zu fr\u00fcheren GPT-4-Modellen die Leistung bei Coding-Benchmarks deutlich nachgelassen hat. Das ist nat\u00fcrlich etwas entt\u00e4uschend.<\/p>\n<p>Besonders auff\u00e4llig ist, dass das Modell anscheinend anf\u00e4lliger f\u00fcr schlampiges Codieren ist. Statt wichtige Codeabschnitte zu schreiben, werden stattdessen Kommentare mit hausaufgaben\u00e4hnlichen Anweisungen hinterlassen. Na, das ist ja mal eine interessante Taktik!<\/p>\n<p>Bei einem Vergleichstest mit 133 Exercism-Python-\u00dcbungen erreichte das GPT-4 Turbo mit Vision-Modell gerade einmal eine Erfolgsquote von 62 Prozent. Das ist der niedrigste Wert unter allen GPT-4-Modellen. Die anderen Modelle schnitten mit 63 bis 66 Prozent nur minimal schlechter ab. Statistisch betrachtet mag das nicht viel ausmachen, aber in Aiders Faulheits-Benchmark sieht die Sache schon anders aus. Hier musste das neue Modell eine Erfolgsquote von mickrigen 34 Prozent hinnehmen &#8211; der niedrigste Wert von allen GPT-4 Turbo-Modellen.<\/p>\n<p>Trotz dieser ersch\u00fctternden Ergebnisse m\u00f6chte Aider weiterhin das neue GPT-4 Turbo mit Vision unterst\u00fctzen. Allerdings empfehlen sie standardm\u00e4\u00dfig die Verwendung des GPT-4-1106-Preview-Modells, da es \u00fcber deutlich verbesserte Coding-F\u00e4higkeiten verf\u00fcgt. Na, das ist doch mal ein guter Tipp!<\/p>\n<p>Aider selbst ist \u00fcbrigens ein ziemlich cooles Befehlszeilentool. Es erm\u00f6glicht Entwicklern, Programme mit GPT-3.5\/GPT-4 zu verbinden und Code in ihrem lokalen Git-Repository zu bearbeiten. Das Beste daran ist, dass Aider die Bearbeitung direkt in den lokalen Quelldateien durchf\u00fchrt und die \u00c4nderungen mit aussagekr\u00e4ftigen Commit-Nachrichten an Git \u00fcbertr\u00e4gt. Das spart Zeit und Nerven!<\/p>\n<p>Das Tool bietet au\u00dferdem die M\u00f6glichkeit, entweder ein neues Projekt zu starten oder mit einem bestehenden Git-Repository zu arbeiten. Aber das wirklich Beeindruckende ist die F\u00e4higkeit von Aider, \u00c4nderungen an bereits bestehenden, umfangreichen Codebasen vornehmen zu k\u00f6nnen. Das ist eine echte Erleichterung f\u00fcr Entwickler, die es leid sind, sich durch tonnenweise Code zu w\u00fchlen.<\/p>\n<p>Also, auch wenn das neue GPT-4 Turbo mit Vision vielleicht nicht ganz das Gelbe vom Ei ist, gibt es immer noch Alternativen wie das GPT-4-1106-Preview-Modell, das von Aider empfohlen wird. Und mit Aider selbst hast du ein m\u00e4chtiges Werkzeug an der Hand, um deine Coding-Aufgaben effizienter zu erledigen.<\/p>\n<p>Schlagw\u00f6rter: Aiders + Faulheits-Benchmark<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Der neueste Bericht des KI-gest\u00fctzten Codiertool-Anbieters Aider hat einige interessante Erkenntnisse \u00fcber das brandneue GPT-4 Turbo mit Vision-Funktion zu Tage gef\u00f6rdert. Und leider sind es keine guten Neuigkeiten. Es scheint, als h\u00e4tte das neue Modell einige Schwierigkeiten mit der Codequalit\u00e4t. Die Analyse zeigt, dass im Vergleich zu fr\u00fcheren GPT-4-Modellen die&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":6781,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-6782","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/6782","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6782"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/6782\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/6781"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6782"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6782"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6782"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}