Umjetna inteligencija AlphaGo Zero nepobjediva je (Komentari IT vijesti (stari web)) @ Bug.hr Forum

11 godina

offline

pon 23.10.2017 20:20

Odgovori Citiraj

Re: Umjetna inteligencija AlphaGo Zero nepobjediva

MrBlc kaže...

Ova nova verzija Go-a je upravo takav sustav gdje je algoritam samo neki početni dio - prvo analizira bazu odigranih poteza, a onda sam eksperimentira i vrti hipotetske situacije i smišlja načine za odvagati koji je potez bolji. U teoriji bi se moglo preskočiti učitavanje baze postojećih poteza i krenuti random potezima, ali bi to vjerojatno bilo puno sporije (učenje, a ne odlučivanje nakon naučenog).

Ne u teoriji, nego je to upravo i ucinjeno u praksi i to i jest po mnogima i najzanimljiviji aspekt:

https://deepmind.com/blog/alphago-zero-learning-scratch/
Previous versions of AlphaGo initially trained on thousands of human amateur and professional games to learn how to play Go. AlphaGo Zero skips this step and learns to play simply by playing games against itself, starting from completely random play. In doing so, it quickly surpassed human level of play and defeated the previously published champion-defeating version of AlphaGo by 100 games to 0.

Sto se tice ihushovog vidjenja AI, podsjeca me na AI effect:
"The AI effect occurs when onlookers discount the behavior of an artificial intelligence program by arguing that it is not real intelligence."
Ili citat D. Hofstadtera: "AI is whatever hasn't been done yet".
Ili M. Kearns: "As soon as someone gets a computer to do it, people say: 'That's not what we meant by intelligence.' People subconsciously are trying to preserve for themselves some special role in the universe."

trajni link nadporuka

4 0 hvala 1

MrBlc

15 godina

odjavljen

offline

pon 23.10.2017 20:30

Odgovori Citiraj

Re: Umjetna inteligencija AlphaGo Zero nepobjediva

Da, vidio sam to kasnije. Članak koji sam čitao kad sam dodatno istraživao je malo nesuvislo skakao s verzije na verziju, pa sam krivo shvatio - mislio sam da se radilo o prvoj fazi učenja, a ne o prošloj verziji.

Privatne poruke su za privatne razgovore. Ne odgovaram na općenita pitanja vezana uz neku temu.

trajni link nadporuka

0 0 hvala 0

ihush

15 godina

offline

pon 23.10.2017 21:44

Odgovori Citiraj

Re: Umjetna inteligencija AlphaGo Zero nepobjediva

Zechina kaže...

..

Ali ti si već sad u ovoj fazi da, čak kad bi ti pred tobom izvrtili kod, ti bi to negirao.

..

Evo ti dobar link, AlphaGo Zero vs AlphaGo Master.

..

- nema pečat. :)

- morao sam na yt-vidjeti tko je crno-bijeli, ovako je izgledalo da je zero-izgubio (lijeva strana logo, zero je bijeli, iduči meč, je crni.. ali nema rezultata?). Računam da zero pobjeđue-gazi.. jer je tako navedeno. :) opet, bez pečata..

no, jel to AI? Ako je samo bolji algoritam, tad bi na jednakom HW bolji algoritam pobjeđivao. Ako je jači hw, tad jednaki algoritam pobjeđuje ili ne gubi.

Ako je inteligencija, samoučenje.. tad algoritam ovisi o ..? inteligenciji koja stvori algoritam. Tad bi na recimo i na slabijem ili jednakom HWu, zero morao pobijediti ili barem parirati. Kad bi se moglo usporediti ta dva koda, tad bi se vidjelo što je algoritam, što je inteligencija ili bruteforce. Koliko sam do sad vidio, bruteforce + algoritam (koji nije AI nego dev-team zadan).

Ako je AI, ako je samoprogramirajući algoritam, samoučenje.. zašto nema neovisnih znanstvenih provjera-dokaza? Testiranje i ponovljivost rezultata? Moramo li imati neuronsku mrežu ili super računala za test?

+ ok, skeptik sam.

što kaže cyberk .. da. :)

no, opis rada Go-zeroa (nature, popularna znanost..) je ok, daleko bolje od npr amazonovog patenta za dronove-punjače baterija... no i dalje bez konkretnih info-činjenica, opisno. + Spominju neural networks.. hmm, ostajem pri tvrdnji/uvjerenju = bruteforce. Prihvatiti kao inteligentan chip-AI, tek kad se može testirati.

C64/TurboModul-OpenSourceProject.org.cn.部分作品为网上收集整理，供开源爱好者学习使用

trajni link nadporuka

0 0 hvala 0

Zechina

8 godina

offline

pon 23.10.2017 23:36

Odgovori Citiraj

Re: Umjetna inteligencija AlphaGo Zero nepobjediva

ihush kaže...

no, jel to AI? Ako je samo bolji algoritam, tad bi na jednakom HW bolji algoritam pobjeđivao. Ako je jači hw, tad jednaki algoritam pobjeđuje ili ne gubi.

Ako je inteligencija, samoučenje.. tad algoritam ovisi o ..? inteligenciji koja stvori algoritam. Tad bi na recimo i na slabijem ili jednakom HWu, zero morao pobijediti ili barem parirati.

Sad si opet skočio sam sebi u usta.

Da si malo bolje pogledao članak iz Nature, znao bi da je Zero na slabijem HW. Točnije:

Prethodna verzija je radila preko više neuralnih mreža i uz (indirektnu-servisnu) pomoć ljudi, ovo je bila samo jedna neuralna mreža, bez ikakve pomoći.

Vježbala je samo na igraćoj ploči, samo preko igraćih "figura".
Bez prethodnog znanja (tabula rasa), čak i bez prethodno ugrađenog "Monte Carlo" algoritma za heurističko (ubrzano) pretraživanje dobitnih poteza iz vlastite baze.

Our program, AlphaGo Zero, differs from AlphaGo Fan and AlphaGo Lee12 in several important aspects.
First and foremost, it is trained solely by self-play reinforcement learning, starting from random play, without any supervision or use of human data.

Second, it uses only the black and white stones from the board as input features.

Third, it uses a single neural network, rather than separate policy and value networks.

Finally, it uses a simpler tree search that relies upon this single neural network to evaluate positions and sample moves, without performing any Monte Carlo rollouts. To achieve these results, we introduce a new reinforcement learning algorithm that incorporates lookahead search inside the training loop, resulting in rapid improvement and precise and stable learning.

Poruka je uređivana zadnji put pon 23.10.2017 23:47 (Zechina).

trajni link nadporuka

1 0 hvala 1