Event over Python Machine Learning (kunstmatige intelligentie) AI en Open Source

Gisteren heeft een leuk event plaatsgevonden met Open Source ontwikkelaars die op dit moment geschiedenis schrijven in Machine Learning (kunstmatige intelligentie) en Python (programmeertaal) en vooral met een doorbraak in Natural Language Processing. De volgende sprekers komen aan bod:

Sofie Van Landeghem:
Software ingenieur met een passie voor data en het verwerken ervan - inclusief Machine Learning en Natural Language Processing. Tegenwoordig is ze werkzaam bij Explosion_ai. Het is heel leuk om te zien dat zoveel slimme vrouwen de wetenschap verbeteren en het vakgebied mooier maken. Hun documentatie is uitermate goed. https://www.youtube.com/c/ExplosionAI

Guido van Rossum:
Python's BDFL-emeritus, gewaardeerd ingenieur bij Microsoft, opgenomen in de Hall of Fellows van het Computer History.
https://computerhistory.org/profile/guido-van-rossum/

Guido Van Rossum is geprikkeld door verschillende vragen over zijn nieuwe uitdaging bij Microsoft:

https://www.contributing.today/february-3-python/python-ama/

“Ik heb vorige maand een stap gezet naar Spacy zodat we NLTK kunnen vervangen en alle modules kunnen vervangen met de modernere Spacy. De eerste testen met deze nieuwe bibliotheek laten nu al verbeteringen zien, zelfs met standaardmodellen zien we al goede resultaten.

Dit online event is in een erg interessant format georganiseerd, voor mij is dit formaat niet nieuw, aangezien we werken via outsourcing. Ik heb sommige mensen al 3/4 jaar in dienst, en ik heb ze nog nooit in het echt gezien. Altijd via Skype of instant messaging-apps. De coronacrisis heeft getoond dat iedereen verplicht is deze werkwijze eens te proberen. We missen natuurlijk normale events maar dit format werkt ook prima. We waren gisteren met meer dan 100 mensen van over de wereld zonder enige vorm van verplaatsing. Dat vind ik echt de toekomst.

Wie een schermopname van het event wil zien verwijs ik door naar YouTube kanaal.

https://www.contributing.today/february-3-python/spacy-v3/

Ik wil nu graag wat kwijt over Machine Learning (kunstmatige intelligentie) en Natural Language Processing:

Specifiek San Francisco. Alle activiteiten daar zijn wereldwijd te volgen, en mensen volgen het voorbeeld van Silicon Valley. Ze maken incubators, investeren in innovatie en proberen technische vooruitgang te boeken, te vereenvoudigen, het productieproces te automatiseren om productiekosten te verlagen en de koopkracht en het gemak te verbeteren. Een echte vooruitgang zal plaatsvinden in landen waar een meerderheid zijn persoonlijke gegevens zal delen in ruil voor gemak en verlaagde kosten in productie en marketing. Mensen beginnen meer en meer te beseffen dat de prijs van van een product voor 25% of zelfs 50% uit marketingkosten bestaat. Daarnaast kan automatisering het productieproces met een factor 10, of zelfs 100 versnellen, en daardoor de prijs van het product doen dalen. Voor goede automatisering hebben we gebruikers- en procesgegevens nodig.

De prijs van een product is ook afhankelijk van de technologie bijvoorbeeld bij Machine Learning (kunstmatige intelligentie) en Natural Language processing. De technologie staat nog in de kinderschoenen en er valt nog veel te leren. Ik zie deze technologie als een kind dat we nog moeten toelaten om nieuwsgierig te zijn. Hoe meer data we hebben om het kind te voeden en te laten leren, hoe groter en sterker het wordt, en hoe meer het ons zal helpen met automatisering in de productieketen en marketing. Kleine kinderen stellen zo’n 100 vragen per dag, en als ze beginnen lezen dan vinden ze hun antwoorden in de boeken. Onze data, onze gegevens, gegevens van onze productie en onze processen, dat zijn de boeken waarmee het kind dergelijke algoritmen kan leren. Is het nodig dat veel data vrij toegankelijk is (bijvoorbeeld voor overheden of bedrijven)? Dat zijn de volgende vragen die nu al lang op tafel liggen.

De uitspraak dat machines leren vanzelf is heel overdreven. Machine Learning (kunstmatige intelligentie) is niets anders dan nieuwe manier van programmeren. Als ingenieur krijgt je veel parameters om mee te werken, hier komt Machine Learning van pas om (in plaats van ingewikkelde logica te schrijven) een Matcher Object of een voorspellingsmodel te maken. Dit proces kan geautomatiseerd worden en dus lijkt het alsof machines kunnen leren terwijl zo’n machine ook kan ‘over-leren’, wat tot ongewenste resultaten die totaal onlogisch zijn kan leiden. Met andere woorden: menselijke creativiteit en begeleiding zullen altijd nodig zijn.

De technologie is op dit moment zo jong dat we er niet blind op kunnen vertrouwen. In veel sectoren is de technologie als een klein kind van 5 jaar dat leert lezen en praten, in andere sectoren is de technologie meer een tiener die al een scooter- of autorijbewijs bezit. In ieder geval heeft de technologie onze zorg en onze data nodig. Anders wordt het een heel beperkt kind en bestaat het risico dat kinderen van andere landen ‘beter onderwijs’ krijgen.

Als we kijken naar landen die de laatste jaren heel snel ontwikkelen, dan zien we bijna altijd openheid, transparantie en een vrijere uitwisseling van gegevens voor betere service.

Dit alles bewijst de intellectuele kracht van computers. Computers zijn tegenwoordig een probleem van nationaal belang: alleen China al is van plan om tegen 2030 150 miljard dollar in de ontwikkeling van de sector te investeren. Het McKinsey Institute heeft berekend dat het totale economische effect van kunstmatige intelligentie 13 biljoen dollar zou kunnen zijn, wat vergelijkbaar is met het economische effect van een stoommachine in de 19e eeuw.

Maar zijn computers echt zo slim? Hoe meer kunstmatige intelligentie ons leven binnenkomt, hoe meer taken we eraan geven, hoe meer we begrijpen dat de intellectuele capaciteiten van machines nog steeds onderschat zijn. Robots die, volgens de voorspellingen van futurologen, miljoenen mensen van hun werk in fabrieken en fabrieken tijd zullen beroven in de komende 10 jaar, vertonen nog steeds een bescheiden succes.

Computerprogramma's hebben geleerd nieuws te verzamelen, maar waarheidsgetrouwe informatie is niet te onderscheiden van nepinformatie. Voor mezelf is nepinformatie niet meer te onderscheiden als ik nu zie wat in Rusland aan het gebeuren is (niet alleen de computer kan niets meer van het nieuws begrijpen).

Het testen van zelfrijdende auto's is in volle gang, maar de auto’s worden nog altijd begeleid door een mens.
Subsidies zullen natuurlijk heel wat helpen, want het personeel dat over de juiste kennis beschikt in dit veld is nog te duur, en ook zij moeten een aantal jaren praktijkervaring achter de rug hebben.
De manier hoe de subsidies verdeeld worden en wie ze (op welke manier) verdeelt, is ook van belang. Soms zie je namelijk dergelijke verhalen (over het personeel) als dat wordt gevraagd, en ook welke technische uitdagingen je te maken hebt en welke impact het zal hebben voor jouw regio.

Onze service heeft een positieve impact en bevordert het werkkapitaal, manier van werken en het zoeken naar personeel van ieder bedrijf. Met onze beproefde, geperfectioneerde methoden helpen we werkgevers bij het vinden van de ideale kandidaten voor hun openstaande vacatures. Onze aanpak is snel, efficiënt en nauwkeurig en zorgt voor een gestroomlijnd wervingsproces.

Nu moeten we onze automatische matching opnieuw implementeren, omdat het nog niet goed is opgelost. Eigenlijk is dit nog niet opgelost in de hele sector (door beperkingen van het huidige algoritme in Machine Learning en het ontbreken van data). We hebben nu alle ontbrekende onderdelen en een team die het zullen proberen op te lossen.

Het ontdekken van nieuw talent kan lastig zijn. Met onze service/platform hoeft dat niet zo te zijn. Wanneer u onze geprogrammeerde oplossingen voor vacatures gebruikt, neemt u afscheid van het gedoe dat gepaard gaat met het vinden van geschikte sollicitanten. Onze technologie is hypermodern en veelomvattend, waardoor we kunnen inspelen op verschillende behoeften van werkgevers. Bereik een breder publiek, vind kwalitatief sterke kandidaten en bouw uw droomteam op. Als u ons in vertrouwen neemt, gaat dat allemaal automatisch. Als dit geen impact heeft op de regio of technisch niet uitdagend is, dan weet ik het ook niet.

Maar het probleem is dat je echt een Subsidioneer (dergelijk beroep bestaat in België, mochten mensen dit niet weten) moet zijn en een precies aantal personen op de loonlijst moet hebben om zeker te weten dat je het verschil kan maken. In onze industrie is het nu mogelijk dat twee/drie mensen meer kunnen doen dan 30, als ze juiste kennis en samenwerking hebben. Regionale impact is niet hetzelfde als het aantal personen op de loonlijst. Naar mijn mening moeten ook bedrijven geholpen worden die in de Pioneerfase zitten en niet alleen grote bedrijven met een lange loonlijst.
Veel impact wordt gecreëerd door Pioniers die het juiste pad afgelegd hebben en meestal zien waar het nog beter kan, en die risico’s nemen.“

“Wist je dat Guido van Rossum iedere morgen een papieren krant leest? Ik heb zo gelachen toen hij het vertelde, ik ken geen enkele persoon die dat doet. Maar ja hij doet het.
Voor marketing op dit moment zie ik mediagroepen/kranten die niet op tijd overgeschakeld zijn en nu verlies lijden uit inkomsten uit advertenties. Naar mijn mening onderschatten ze de invloed van technologie en innovatie en wachten ze te lang totdat nieuwkomers echt winstgevend worden, en dan proberen ze ongeveer hetzelfde te maken maar beter. Zo werkt het niet, want de eerste met het idee heeft altijd het meeste voordeel. Als een technologie winstgevend begint te worden, en anderen beginnen te merken dat iemand goed verdient, dan zijn ze meestal al te laat voor dit idee, de eerste partij heeft al een voorsprong van aantal jaren en de nieuwkomers hebben geen geld waarmee ze gelijk kunnen beginnen. Ze moeten veel meer geld durven investeren, want slechts 10% zal slagen en sommigen zijn te vroeg of te laat of helemaal niet nuttig is.

Het belangrijkste is om te concentreren op ontwikkeling van nieuwe technologie en het verbeteren van de klanttevredenheid (dus minder over concurrentie denken en meer over klanten). Alleen de problemen oplossen van de klanten is de sleutel tot succes.

In Europa en de VS veroorzaken vorderingen als GDPR kettingreacties in al onze aspecten van leven, en leiden meestal tot het verhogen van kosten voor productie en marketing, wat gevolgen heeft voor onze koopkracht, tevredenheid en ons werkkapitaal.

Ik zie nu nog meer en meer slimme personen die er in hun eentje in slagen om te concurreren met multinationals en mediagroepen, met ongeveer dezelfde producten maar zij doen het slimmer met toepassing van lokale kennis. Ook richten zij zich naar klanten toe en bieden oplossingen voor echte reële problemen van klanten.

De technologische trends begrijpen die onze toekomst zullen bepalen:
William Gibson, een Amerikaanse sciencefictionschrijver, zei ooit: "De toekomst is al gekomen, hij is gewoon ongelijk verdeeld." ik werk al jaren in het veld waarin deze toekomst het meest geconcentreerd is - op het gebied van digitale technologieën. Daarom weet ik dat het onmogelijke gebeurt en zelfs algemeen wordt.

Vandaag de dag zie ik de belangrijkste, grootschalige en veelbelovende technologische trends die onvermijdelijk de samenleving, de economie en ons leven in de komende decennia zullen veranderen. Maar dit is geen uitspraak met profetieën en voorspellingen, maar een analyse van die processen die al zichtbaar zijn en waarvan de ontwikkelingsvector duidelijk is voor iemand met verbeeldingskracht en ervaring in IT.

Deze processen opereren undercover, onmerkbaar, ze werken samen, vullen elkaar aan en versterken elkaar. Bovendien versnellen ze voortdurend en daarmee naderen we onophoudelijk onze digitale toekomst. Ik beschouw onze toekomst echter helemaal niet als vooraf bepaald en onafhankelijk van de menselijke wil. Er is een interne logica in de ontwikkeling van technologieën, omdat ze vertrouwen op de objectieve wetten van de natuurkunde en wiskunde, maar een mens is heel goed in staat om technologieën te beheersen en ervoor te zorgen dat ze de mens dienen. De trends die door mij zijn geïdentificeerd, laten zien hoe onze toekomst eruitziet, en de route naar die toekomst toe.

Elke poging om deze route te belemmeren of te stoppen, is gedoemd te mislukken. In plaats van te worstelen met de objectieve wetten van ontwikkeling, is het beter te proberen om ze te begrijpen en er voordeel mee te doen.

Stel je voor: begin jaren negentig, dachten de meest gevestigde mediagroepen serieus dat internet nooit echt populair zou worden. Grote media-experts waren er absoluut zeker van dat hun publiek nooit de afschriften van de bank zou willen halen via internet en zich niet alleen online zou vermaken. Daarmee hebben ze een ontzettend grote mogelijkheid gemist! Degenen die in staat waren om nieuwe trends te onderscheiden, waren succesvol. Maar wie denkt dat er nu minder kansen zijn voor een ondernemend persoon dan dertig jaar geleden, heeft het mis. Moderne technologie heeft de weg geopend voor werkelijk ontwrichtende innovatie. Alles trends en fantastische ideeën die de mens over 20 a 30 jaar zal kennen, zijn nu nog niet uitgevonden of slechts in een zeer vroeg stadium van ontwikkeling.
Dit betekent dat het niet te laat is, en dat is goed nieuws.

Deze lezing zit vol met interessante ideeën, helder geschreven, met veel voorbeelden en
verwijzingen naar eigen ervaringen. Ik probeer met het door mij geschetste toekomstbeeld optimisme bij u op te wekken en u te enthousiasmeren.

Ik erken dat de processen die ik beschrijf potentieel gevaarlijk kunnen zijn, maar ik richt me om twee redenen niet op de risico's van de digitale toekomst. Ten eerste zullen criminele technologieën dezelfde trends volgen: decentralisatie, doorstroming, tracking, enz. Ten tweede, net zoals elke goede uitvinding ook voor kwade doeleinden geschikt is, bieden alle uitvindingen met kwade doeleinden nieuwe kansen voor het gemeenschappelijk belang.

De snelheid van updates zal constant toe nemen. Als gevolg hiervan zullen we voortdurend nieuwe, veranderende technologieën tegenkomen, wat betekent dat we, ongeacht leeftijd en ervaring, voor altijd "amateurs" zullen blijven, en met al onze kracht proberen de vooruitgang bij te houden.

Voortdurende veranderingen in technologie geven aanleiding tot nieuwe verlangens en behoeften in ons. We willen constant meer, beter, nieuw. Deze onvrede is een stimulans voor de ontwikkeling en creatie van nieuwe uitvindingen. Door voor onszelf nieuwe behoeften te bedenken, creëren we middelen om ze te bevredigen. We verleggen de grenzen van het mogelijke.

Ongeveer 20 jaar geleden hadden we niet eens een vermoeden van het bestaan van een wereldwijd netwerk, maar nu worden we pissig door een matige internetsnelheid. In het afgelopen decennium had iedereen smartphones nodig, terwijl we vroeger zonder deden.

De meeste mensen zijn bang voor de toekomst omdat ze teleurgesteld zijn in utopieën.
Utopieën zijn niet alleen fysiek onmogelijk, maar ook ongewenst omdat ze impliceren dat er geen mogelijkheid tot ontwikkeling is. Om de moderne samenleving te karakteriseren, stel ik de term ‘protopia’ voor, waarin het voorvoegsel ‘pro’ semantisch verbonden is met de woorden vooruitgang en proces, proactiviteit. Protopia is een staat van constante wording en verandering, geen resultaat, maar een eeuwige beweging. De problemen van vandaag zijn de oorzaak van de technologische vooruitgang van gisteren, en door de middelen te creëren om de problemen van vandaag op te lossen, brengen we nog meer problemen voor morgen tot leven. Dit proces is erg moeilijk waar te nemen omdat veranderingen constant en onbeduidend zijn, en ons vermogen om ze waar te nemen is verminderd.
Natuurlijk, door iets nieuws te creëren, vernietigen we onvermijdelijk het bestaande. Maar toch slaagt de mensheid er altijd in om iets meer en iets beters te creëren dan wat het heeft vernietigd. Deze kleine vooruitgang is dus de progressie.

Hoe ziet het internet er over drie jaar uit? Tot nu toe is een vrij groot deel van de digitale wereld aangesloten aan zoekmachines. In de toekomst zal alle inhoud van het internet via links bereikt kunnen worden. Links zullen zelfs fysieke objecten verbinden. We kunnen via internet zoeken naar bijvoorbeeld dingen in onze kamer. Het netwerk zal een permanente aanwezigheid worden, de achtergrond van ons leven, onmerkbaar, maar noodzakelijk, zoals elektriciteit. Die informatie is bekend maar hoe zal het verder gaan, verder dan slimme suggesties van resultaten?

Ontwikkeling van kunstmatige intelligentie:
De wereld zal door goedkope en betaalbare kunstmatige intelligentie veranderen. De eerste echte AI (kunstmatige intelligentie) is al online. Elk apparaat of elke persoon die zich bij dit netwerk aansluit, kan zijn intelligentie gebruiken en de intelligentie tegelijkertijd verrijken met eigen modellen en data. AI is constant aan het leren en een aanvulling voor applicaties: we kunnen het gebruiken als dat nodig is. Alles kan "slimmer" worden gemaakt door er een rang in te bouwen en cloudtechnologieën te gebruiken, om het te verbinden met wereldwijde kunstmatige intelligentie. Google en Amazon hebben al producten op de markt die we kunnen integreren. Niet ideaal maar het werkt wel.

Het eerder vandaag besproken Spacy 3 is naar mijn mening een uitstekende tool voor Natural Language Processing.

Applicaties die razendsnel moeten draaien, en hun data exclusief willen gebruiken, proberen hun eigen pad te vinden in libraries en frameworks. Spacy is een voorbeeld van een industriëel krachtig Natural Language Processing framework dat voldoene mogelijkheden heeft en volledig open source is.

Features van Spacy:

Niet-destructieve tokenisatie
Benoemde entiteitsherkenning
Ondersteuning voor 61+ talen
46 statistische modellen voor 16 talen
Voorgetrainde woordvectoren
State-of-the-art snelheid
Eenvoudige integratie van deep learning
Tagging van delen van spraak
Gelabelde afhankelijkheidsparsing
Syntaxisgestuurde zinsegmentatie
Ingebouwde visualizers voor syntaxis en NER
Handige string-to-hash mapping
Exporteren naar numpy data-arrays
Efficiënte binaire serialisatie
Eenvoudige modelverpakking en implementatie
Robuuste, zorgvuldig geëvalueerde nauwkeurigheid

Conclusie:

Vandaag leven we in versie 2.0 van het leven, dat ongeveer 100 duizend jaar geleden ontstond. De vorige versie, 1.0, ontstond 4 miljoen jaar geleden en kon het programma noch het ontwerp veranderen. We verbeterden onze programmacode - we leerden nieuwe vaardigheden, veranderden opvattingen en brachten zelfs kleine wijzigingen aan in het ontwerp - we implanteerden tandheelkundige implantaten en transplanteerden organen. Niet ver weg is echter een nieuwe levensvorm - 3.0, waarin het mogelijk zal zijn om zowel de programmacode als het uiterlijk van het organisme te veranderen (of de volledige afwezigheid ervan).
Onder wetenschappers en gewone mensen bestaat discussie over de datum van de opkomst van de kunstmatige superintelligentie, over hoe het precies zal verschijnen en hoe het mensen zal beïnvloeden. Deze controverses leiden tot tegenstrijdige verhalen. Een ding is duidelijk: kunstmatige intelligentie kan ons leven aanzienlijk verbeteren - op voorwaarde dat we niet overhaast nieuwe apparaten in gebruik nemen. Allereerst moet de technologie worden geverifieerd, gevalideerd, gecontroleerd en betrouwbaar zijn. De kosten van het maken van een fout zijn te hoog.

Ik voorspel dat mensen in de toekomst niet zullen hoeven werken. Ze zullen een gegarandeerd basisinkomen kunnen ontvangen. Beroepen gebaseerd op repetitieve handelingen en nauwkeurige berekeningen zullen in de vergetelheid raken. Maar er zal werk zijn voor flexibele, creatieve mensen met ontwikkelde sociale vaardigheden. Op het gebied van recht en orde worden ook grote veranderingen verwacht: onvermoeibare en onvergankelijke robot-politie en robot-rechters zullen effectiever zijn dan mensen.

10 afsluitende gedachten:

1. Diep leren is ondoorzichtig, beperkt en niet doeltreffend als je werkt met een minimum aan gegevens en niet weet hoe de gegevens tot een compleet beeld moeten worden verbonden. Diep betekent niet slim, het gaat alleen om het aantal neurale lagen in het netwerk en niet om de volledigheid van het begrijpen van de wereld.

2. Alle technologische vooruitgang is gericht op het creëren van relatief niet-intelligente machines die vrij beperkte taken uitvoeren en vertrouwen op blinde data correlaties. Dat is goed voor Facebook, Google en Vindazo die werken met eenvoudige bewerkingen en suggesties via NLP.

3. Overschat een supercomputer niet die eerst met schaken en daarna met Go won. In gesloten systemen met bepaalde, strikt vastgelegde regels is AND echt heel effectief. Maar de hele wereld om ons heen is een open, onvoorspelbaar systeem.

4. We zijn zwakker dan een computer omdat we moe, afgeleid en onderhevig zijn aan emoties. Maar we zijn onmetelijk sterker dan een computer, omdat we een samenhangend beeld van de werkelijkheid hebben en zelfs met een minimum aan beschikbare informatie opnieuw kunnen leren.

5. Twee belangrijke kenmerken die getuigen van de triomf van AI, waren het vermogen om te lezen en het vermogen van robots om mensen in verschillende levenssferen te vervangen. Maar tot nu toe begrijpt de computer de betekenis van elementaire teksten beperkt, en de hoogst beschikbare prestatie van robotica is een robot-stofzuiger.

6. De machines zelf laten leren? Handmatig alles coderen wat machines moeten weten? Geen van beide: je moet een compromis zoeken, maar je zult het niet vinden in de deep-learning-methodologie die tegenwoordig wordt toegepast.

7. Een universele manier om gezond verstand aan te passen aan een computer bestaat niet, maar je kunt er wel meerdere tegelijk gebruiken. Alle computers liggen in de sfeer van de klassieke AI, waarnaar het niet te laat is om terug te keren.

8. De Turing-test en de wetten van de robotica van Asimov zijn alleen theoretisch gezien goed.

9. Het echte gevaar is niet dat AI morgen de wereld zal onderwerpen aan zijn macht, maar dat we vandaag de dag volledig vertrouwen op onbewerkte technologische oplossingen die verre van echte intelligentie zijn.

10. AI zal onvermijdelijk wijzer worden, maar of het de geest van een onvolwassen tiener zal zijn (de optie van vandaag) of bewuste intelligentie, dat beslist de mensheid.”

Zoeken in deze blog