Molurus Met 'elk denkbaar probleem oplossen' bedoel ik in deze zin niet letterlijk dat elk probleem succesvol opgelost kan worden (er zijn ten slotte ook problemen zonder oplossing, om maar iets te noemen), maar dat het intelligentie in kan zetten om dichter bij de oplossing te komen. Als ik jou nu vraag om te golfen dan kun je dat gaan doen, zelfs al heb je het nog nooit gedaan. AlphaZero moet eerst getraind worden om te kunnen golfen voor het überhaupt een concept heeft van wat dat in zou houden. Een General AI zou net als een mens direct een poging kunnen wagen (en wellicht steeds beter worden met oefening).
Kunstmatige intelligentie
Reya Ik vraag me wel af hoe je er voor zou zorgen dat als een ML-systeem zijn eigen doelen laat definiëren, je er nog een 'nuttige' uitkomst uit kan halen. De doelen die voor zo'n netwerk relevant lijken hoeven natuurlijk vanuit menselijk perspectief helemaal niet begrijpelijk of relevant te zijn.
ML is echt zo'n onderwerp waarvan ik wou dat ik er meer van begreep.
tsjok Ik vraag me wel af hoe je er voor zou zorgen dat als een ML-systeem zijn eigen doelen laat definiëren, je er nog een 'nuttige' uitkomst uit kan halen. De doelen die voor zo'n netwerk relevant lijken hoeven natuurlijk vanuit menselijk perspectief helemaal niet begrijpelijk of relevant te zijn.
Je hoeft het ook niet direct in "zuivere" zin te zien. De verwijzing van AlphaZero van Molurus is ook weer niet zo vreemd, omdat AlphaZero de restricties die het is opgelegd (het doel is het winnen van het spel binnen de regels) op zo'n manier gebruikt dat het bijna niet meer navolgbaar is. Je zou dat progressief kunnen toepassen op complexere systemen met meer fluïde doelen, en dan zul je ook meer en meer zien dat systemen onnavolgbare tactieken en strategieën zullen implementeren.
- Edited
Reya Interessanter is hoe je een systeem als AlphaZero zou kunnen gebruiken voor zuiver unsupervised learning - dergelijke vormen van ML worden nu vooral gebruikt (vanuit menselijk perspectief) om betere inzichten in datastructuren te krijgen, maar zou iets als AlphaZero binnen zo'n systeem ook zijn eigen relevante doelen kunnen definiëren?
Ik zou eigenlijk niet weten waarom niet, of waarom dit iets fundamenteel anders zou zijn dan het bepalen van deel-doelen in een schaakspel.
De vraag of hij zelf ook, in de kosmos, doelen kan bepalen voelt een beetje aan als de vrije wil discussie. Of de mens werkelijk andere doelen kan kiezen die niet voortvloeien uit onze evolutionaire achtergrond en ons doel om succesvol te bestaan is ook maar de vraag.
De wereld van de mens is vooral groter dan die van een AI systeem die Starcraft speelt. Maar ik zie geen essentiele verschillen in de manier waarop daarmee wordt omgegaan.
tsjok Als ik jou nu vraag om te golfen dan kun je dat gaan doen, zelfs al heb je het nog nooit gedaan. AlphaZero moet eerst getraind worden om te kunnen golfen voor het überhaupt een concept heeft van wat dat in zou houden.
Dit klinkt, maar corrigeer me vooral als je iets anders bedoelt, alsof je denkt dat een mens niet hoeft te trainen om een schaakgrootmeester te worden terwijl AlphaZero dat wel moet. Dit lijkt me eerlijk gezegd absurd. Wij moeten dat ook leren. Als je een kind de golfbaan opstuurt om een potje golf te spelen mag je blij zijn als hij de bal raakt.
Dus waarin je hier nu een fundamenteel ziet is mij eerlijk gezegd een volslagen raadsel. Elk intelligent systeem moet dingen leren, ook mensen.
tsjok Als ik het goed begrijp zijn de overwegingen/tussenstappen van AlphaZero fundamenteel onkenbaar, toch? Hoe weten we dan dat de tactieken onnavolgbaar zijn?
Kijken naar neurale netwerken in actie is een beetje alsof je probeert door met een microscoop te kijken naar menselijke hersenen te ontdekken wat jij allemaal denkt tijdens het lezen van deze post. Het is 1 grote brei.
Hoe we weten dat de tactieken in, bijvoorbeeld, het schaken onnavolgbaar zijn vereist vrees ik wel enige minimale kennis van het schaakspel. Maar op goed geluk en in de hoop dat je er iets van meekrijgt, hier Daniel King over een inmiddels redelijk oude partij van AlphaZero en zijn perceptie van wat daar gebeurt:
Reya Onnavolgbaar meer in overdrachtelijke zin. Als je Carlsen of Nakamura live een AlphaZero partij laat analyseren, zullen ze met enige regelmaat versteld staan van de zetten van AZ, omdat die geënt zijn op een positioneel begrip dat het menselijk inzicht te boven gaat.
Het is natuurlijk al vrij lang zo dat schaakcomputers veel sterker zijn dan mensen. Dat was met Stockfish ook al lang zo. Toch is dat altijd geweest op het niveau van 'kunst! Die computers kunnen foutloos 20 zetten vooruit rekenen, en daarmee wordt elke fout gewoon genadeloos afgestraft'. Bij AlphaZero lijkt het er echter, voor het eerst, sterk op dat hij niet alleen goed kan rekenen maar ook conceptueel het spel fundamenteel anders benadert.
Maar zoals gezegd: er is wel begrip van schaken an sich voor nodig om dat engiszins op waarde te schatten.
Molurus Uiteraard bedoel ik iets anders - anders zou mijn stelling kolder zijn.
Als je de video kijkt waar je net na een blik op de publicatiedatum aan voobij ging wordt het prima uitgelegd, maar goed. Om even van een site te plukken:
Narrow AI: “a specific type of artificial intelligence in which a technology outperforms humans in some very narrowly defined task. Unlike general artificial intelligence, narrow artificial intelligence focuses on a single subset of cognitive abilities and advances in that spectrum.”
Het onderscheid met General AI zit hem in dat Narrow AI één vooraf gedefinieerde taak beheerst. AlphaZero kan niet iets buiten de taken die gedefinieerd zijn; of dat nou Go winnen is, of Schaken winnen. Hetzelfde geldt voor de AI die Google's zelfrijdende auto bestuurt. Het onderscheid met General AI is dat bij een General AI de taken niet vooraf hoeven worden gedefinieerd; een General AI kan "alles". Dat is vergelijkbaar met een menselijk brein, want mensen hoeven óók niet letterlijk elk doel apart te leren om iets te kunnen. Natuurlijk is de oplossings- en rekencapaciteit van mensen vrij beperkt, maar dat is fundamenteel niet het punt.
Molurus Het is natuurlijk al vrij lang zo dat schaakcomputers veel sterker zijn dan mensen. Dat was met Stockfish ook al lang zo. Toch is dat altijd geweest op het niveau van 'kunst! Die computers kunnen foutloos 20 zetten vooruit rekenen, en daarmee wordt elke fout gewoon genadeloos afgestraft'. Bij AlphaZero lijkt het er echter, voor het eerst, sterk op dat hij niet alleen goed kan rekenen maar ook conceptueel het spel fundamenteel anders benadert.
Jep, daar wilde ik net al een post over typen eigenlijk. Dat is ook wat AlphaZero (en anderen) zo bijzonder maakt. Heel lang was computerschaken gewoon ontzettend snel een extreem groot aantal zetten berekenen en daaruit de optimale keuze kiezen (DeepBlue berekende bijvoorbeeld 200 miljoen zetten per seconde). AlphaZero lijkt daar totaal niet op afgezien van de uitkomst.
Overigens kan ik schaken, Molurus.
tsjok Het onderscheid met General AI zit hem in dat Narrow AI één vooraf gedefinieerde taak beheerst. AlphaZero kan niet iets buiten de taken die gedefinieerd zijn; of dat nou Go winnen is, of Schaken winnen.
Ok, dan is het vooral deze aanname die onjuist is volgens mij. AlphaZero is niet 'narrow' in deze zin.
tsjok Iets minder denigrerend zou prettig zijn.
Vandaar 'niet vervelend bedoeld' (nee echt niet).
Er zit gewoon een enorm gat tussen de regels kennen, een aardig potje kunnen spelen, een grondig begrip hebben van het schaakspel, en meesterniveau.
Ik schat dat je al gauw rond rating 1900-2000 moet zitten om enigszins te zien wat inhoudelijk het verschil is tussen Stockfish en AlphaZero. En volgens mij kom je daar nog niet aan. (Dat zou je wellicht best kunnen als je jezelf dat als doel stelt.)
- Edited
Ja je kunt hier helemaal doordraven dat een schaak-computer volledige AI is, en zeker niet 'narrow'. Per definitie is een narrow AI iets dat een bepaald probleem oplost, een schaak computer dus.
Men wil in de AI sector nog wel aardig doordraven dat hun stuk code een mens moet voorstellen, maar dat valt nog wel mee hoor.
Maar goed, het daadwerkelijk programmeren van dit soort meuk zal wel niet voldoende ervaring zijn. Je moet een schaakmeester zijn.
- Edited
Als die juist was zou het niks anders kunnen leren dan een specifieke set van problemen. Intussen is het Deep Mind team aan de lopende band aan het experimenteren met diverse problemen waar dit systeem niet voor is gebouwd, met uiteenlopend succes.
En het lijkt erop dat je tot vandaag niet wist dat dat ding uberhaupt iets anders kan dan schaken.
PolitiekGeaard Ja je kunt hier helemaal doordraven dat een schaak-computer volledige AI is, en zeker niet 'narrow'. Per definitie is een narrow AI iets dat een bepaald probleem oplost, een schaak computer dus.
Dat is nou juist het punt: AlphaZero is fundamenteel geen schaakcomputer. Het was een gericht experiment om te zien wat dit ding zoal kan oplossen. Niet heel anders dan kijken of je kleine neefje kan schaken.