Sen o programującej AI

stasiek · June 27, 2025, 10:11am

AI zawsze mówi prawdę, tylko nie zawsze określa warunki brzegowe
Kto powiedział AI, że to skrzydło ma działać na Ziemii, a nie na Marsie?
Będzie potrzeba batalionu specjalistów do określania warunków brzegowych dla AI^^

Koncereyra · June 27, 2025, 10:44am

LLMy przecież “mówią to” co ma maksymalizować prawdopodobieństwo bycia pozytywnie ocenionym przez dane testowe:) W sensie mowią to “co autor chiałby żeby mówiły”.

To mi się podoba, AI będzie robiło za nas “TPS reports” które czytać będzie inne AI:)

Natomiast z poważnych rzeczy to wrzucę to znowu wywiad z Hintonem. On ma bardzo dużo racji tam gdzie mówi o tym co robi/co może/czego nie może AI. Trochę mniej ufam jego diagnozom jak funcjonuje społeczeństwo. Natomiast predykcja “dekady chaosu” spowodawana destabilizacją społecznego ekwilibruum z jednej strony przez AI zabierając BSjobs, a z drugiej strony przez kryzyz zadłużeniowo-inflacyjny jest mi bliska.

PawelW · June 27, 2025, 11:25am

MBSE i zarządzanie wymaganiami się kłania

Przewidziano to już w pop-kulturze (TNG Booby trap vs TNG Galaxy’s Child)

DITO.

stasiek · June 27, 2025, 11:53am

Nowa religia? Wiara w wierne modele i bezbłędne emulatory rzeczywistości Powinno działać, jeśli będziesz krążyć po wystandaryzowanych rozwiązaniach. A co się stanie jeśli będziesz chciał testować manowce techniki?

gruby · June 27, 2025, 12:56pm

Czyli nie rozwiązują problemów w sposób dający się matematycznie udowodnić. Co ogranicza ich spektrum zastosowania do wymyślania bajek dla dzieci, rysowania rycerzy na koniach ewentualnie koni ujeżdżających rycerzy.

Koncereyra · June 27, 2025, 2:20pm

Jeśli autor LLMa (a nie pytania!) wytrenował go tak by rozumował logicznie, to są bardzo dobre w rozwiązywaniu zagadek logicznych, zadań matematycznych i programistycznych. Zwłaszcza a trybie agent/reasoning gdzie same ze sobą gadają i próbują poprawić błędy (np jak programują i dostają informacje zwrotną od kompilatora, że nie działa).

Cursor/GitHub Copilot etc one nie są bardzo mądre, ale takie na poziomie przeciętnego junior deva, który wykuł na blachę stackoverflow. Od przyszłego tygodnia zabieram się na zbieranie przykładów co działa/co nie działa w takim AI-vibe-coding.

uberbot · June 27, 2025, 4:00pm

To tak w przerwie moje pierwsze EjAj

a tu przerwa

3r3 · June 27, 2025, 6:17pm

Nie gdyż… ma bardzo dużo bezpieczników przed przepełnieniem.
Długo to testowałem i przeglądałem architekturę pod tym kątem.
Do tego trzeba im podpinać moduł który nie jest LLMem, ale wprowadza dane zwracane tak jak “toughts” z rozkładu i wtedy da się tego używać.
Przy czym zależy to od głębokości analizy i LLM się do inheritów nie nadaje. Nie jest młotkiem na te gwoździe.

Tak, ale to akurat jest dość niesprawne w LLM. Interpretacja tak, logika nie tędy.
Wyłącznie dlatego, że LLM generuje sam sobie dużo śmiecia do operowania logiką i później to wszystko musi przerzucać. Overflow jak diabli.

Ponieważ tam trzeba robić dużo bezmyślnej roboty - copil po prostu uczy się co najczęściej musi userowi robić i mu głównie kopiuj wklej ułatwia.

Koncereyra · June 28, 2025, 8:45am

Ja nie mówię, że to jest wydajne. Mówię, że LLM podpięty do pętli zwrotnej formalnej weryfikacji (kompilator) potrafi się sam korygować i działa zaskakujaco dobrze (tzn zdecydowanie lepiej niż losowy człowiek wzięty z ulicy).

Tak, ale powiedzmy to już dziś zaczyna być standard.

Chciałbym zobaczyć na przykładach, co się nie spina.

stasiek · June 28, 2025, 9:03am

I powinno, bo w przeciwieństwie do losowego człowieka LLM ma jakąś wiedzę skojarzeniową, mniej więcej wie w jakim kościele dzwoni. Losowy człowiek może nie rozumieć nawet pytania.
To takie testowanie punktu małpy, czyli ile da się uzyskać poprawnych wyników z podanych losowo odpowiedzi.
Tutaj mamy podobną sytuację. Każdy junior assistant, czy jak go zwał innych branżach technicznych, potrafi dobrze działać, ale wymaga kontroli i korygowania głupich pomysłów.

3r3 · June 28, 2025, 9:18am

Jeśli nie jest to ulica przed wydziałem dla czubków zaraz przed zajęciami^^

Ale nie w LLMach “dla ludu”. Tylko trzeba sobie skonfigurować wiedząc co i po kiego się robi.

W takim “dla ludu” wrzucasz mu na przykład (testowałem) wielokrotnie zagnieżdżone funkcję (z gita cały program) i każesz prześledzić parametr lub!

Wersja prostsza:
Dajesz równanie z relatywistyki gdzie masz pęd w kwadracie coś do czwartej, wszystko pod pierwiastkiem, prędkości etc… i proponujesz podmienić wartość c z 1 na i stawiając pytanie co się zmieni.
No więc LLM odpowie co się zmieni. I musisz go kijem pchać, że v/c jest proporcją w tych samych jednostkach, i że później do kwadratu, i że w pędzie też jest v w tej samej jednostce, więc jak już wszystko wykwadracisz i wypierwaszczysz to równanie jest odporne na podstawianie tam i więc wyjdzie to samo co było. Równanie jest odporne na majstrowanie przy pierścieniu (taką ma konstrukcję i dlatego można tam użyć 1 jako hyperreal infinity i 0 jako epsilona).

Później wywalasz jego łańcuszek głupich pomysłów i każesz wypluć gdzie mu się bezpieczniki włączyły. Otóż ma bezpieczniki przed infinite loop przeszukiwania zagnieżdżeń wgłąb. A pierwiastki nad kwadratami traktuje jako pochodne po sin cos. Czyli że to się nigdy nie skończy.

LLM też nic nie rozumie, ale też umie udzielić odpowiedzi. Od ludziów się uczył.

Dokładnie. Wszystko leży kiedy potrzeba logiki.

Trójfazowym kablem przez plecy.

stasiek · June 28, 2025, 9:32am

NIe po to wynaleziono światłowód w pancerzu aramidowym, aby z kablem trójfazowym się męczyć^^

gruby · June 28, 2025, 10:00am

Po wylądowaniu na ziemi Wielkich Brytoli czekała na mnie kolejka do imigracji gdzie urzędnik JKMa (w tym kontekście: jego królewskiej mości) sprawdzał czy wolno mi będzie opuścić halę przylotów.

Czekających w kolejce do przejścia granicznego atakował zestaw plakatów wydrukowanych przez Border Force. Pierwszy plakat skierował mnie do bio-urzędnika z pagonami i czapką ew. innym turbanem, drugi plakat skierował mnie do zautomatyzowanej bramki z elektronicznym czytnikiem paszportów oraz elektronicznym mordochwytem.

Obydwa polecenia wisiały obok siebie i byłbym je sfotografował ale przewidujący urzędnicy zabronili robić zdjęcia w hali przylotów.

Podróżni po wyjściu z samolotu sami wiedzieli w kórej kolejce się ustawić mimo wzajemnie wykluczających się poleceń z plakatów printed by Border Force.

Wyszło na to że oblałem test na małpę. Border Force górą. Dwójmyślenie rulez.

Koncereyra · June 28, 2025, 10:20am

No ok, to teraz rozumiem problem. Ale jak chcemy wiedzieć co AI będzie mogło z łatwością robic za rok to musimy patrzeć na te “niepopulistyczne” modele. Lud to wiadomo: najpopularniejszym zastosowaniem generative-AI byłoby interaktywne porno, gdyby nie to, że to jeszcze nie ten poziom wydajności by robić to real time:)

Pomieszkasz jeszcze trochę to się nauczysz

3r3 · June 28, 2025, 10:52am

Ejaj tak, LLM nie do tego służy. Nie w tę stronę.
LLM jako translator z ludzkiego na wolframowe - tak.
Mamy klocki - będą składane. Będą w pętlach.

Podejrzewam, że to akurat będzie szybciej niż Twoje zastosowanie, ponieważ za to ktoś zapłaci. Wielu ktosiów.

Eltor · June 29, 2025, 8:56pm

Rynek pięknych pań i ich wdzięków eksploduje?

PawelW · June 29, 2025, 9:12pm

Na razie idzie w kierunku zastąpienia :
https://www.threads.com/@djdemi…/post/DK1FCTSuQaT/media

https://www.youtube.com/watch?v=laXUf5oBJ-U

Znowu Chung Kuo miało w tej kwestii wizję

Axesider · June 30, 2025, 7:58am

Szacunkowo 12% kobiet w wieku 20–24 lata w USA może być “twórczyniami” na OnlyFans

gruby · June 30, 2025, 9:19am

gapić się w monitor przez cały dzień to jedno.
Wpychać w niego to jednak wyższy stopień perwersji.

3r3 · June 30, 2025, 2:01pm

Samice mają inne odruchy. Muszą wytrenować.

Pewnie dekady temu inaczej bym to widział. Ale w tym wieku jak założę okulary to dobrze je widać.