Categorieën
Article

Big Data: kort en simpel

Ik voelde toch enige opluchting, toen op een congres voor data scientists bleek dat ook daar niet iedereen het erover eens was wanneer ‘gewone’ data eindigt en ‘Big Data’ begint. En wat voor de ene organisatie gewoon data is, betekent voor een kleinere organisatie misschien big.

Enerzijds kan je Big Data op een kwantitatieve manier definiëren. Zo hoorde ik een definitie: ‘wanneer je het niet meer gewoon in een database kan stoppen en er een SQL query op loslaten, is het Big Data’. Dat betekent met andere woorden dat data met pakweg 650,000 records prima bruikbaar zijn en dus gewone data. Maar een dataset met 18.908.000.000 records, zoals de Event Database van het Google GDELT project, is niet langer benaderbaar met klassieke tools en machines. Grootte bepaalt dus of data Big is of niet.

Maar niet alleen omvang maakt dat data Big is. De complexiteit van data en de kracht van data om er correcte en relevante conclusies en voorspellingen uit te halen, maken evenzeer of het label Big van toepassing is. Het onderwerp van de data en de daaraan gekoppelde voorspellende kracht bepalen dus ook in welke mate die data als Big beschouwd kunnen worden. Een ontzettend grote hoop losse gegevens waar je onmogelijk conclusies of voorspellingen uit kan berekenen blijven een grote hoop en dus geen Big Data.

Om het kort samen te vatten: Big Data zijn extreem grote data sets die door computer analyse informatie over patronen kunnen blootleggen en trends kunnen voorspellen.

Categorieën
Article

Natural language processing, euh?

Dit is een gast artikel van Guy De Pauw, founder van Textgain.

Computerlinguïsten hebben een geweldige baan! Tot die opmerkelijke conclusie kwam het Amerikaanse HR-bedrijf Brazen enkele jaren geleden. Maar waarom juist? Taaltechnologie ontwikkelen is vaak een erg ondankbare bezigheid: we hebben allemaal al wel eens gegiecheld om de kromme vertalingen van Google Translate en de spell checker van Microsoft Word laat onze DT-fouten vaak vrolijk staan. En hoewel computers ondertussen tot aan de rand van het heelal kunnen theoretiseren,  kost het hen nog steeds een heleboel moeite om te bevatten dat je de bank in je woonkamer niet om een hypotheek kan vragen.

Taal is een complex cultureel gegeven waar computers slechts beperkt vat op lijken te krijgen. Het is de taak van computerlinguïsten om hen daarbij te helpen. Het vereist niet alleen inzicht in hoe mensen taal produceren en verwerken maar ook en vooral inzicht in zowel de cognitieve beperkingen als sterktes van computers. In de beginjaren van de computerlinguïstiek probeerden we vooral instructies te verzinnen die computers stap voor stap moesten volgen om taalkundige analyses te maken. Tegenwoordig leren we computers taal te verwerken door hen massa’s voorbeelden aan te bieden en hen met behulp van machine learning technieken zelf een analysemodel te laten creëren. En dat werkt een pak beter: we dwingen ze niet meer in een menselijke vorm van taalverwerking, maar laten hen toe om op eigen houtje patronen te ontdekken in grote multidimensionale ruimtes volgestouwd met taaldata.

Op die manier kan je computermodellen ontwikkelen die aan nieuwe teksten een categorie kunnen toekennen, van grammaticale structuren tot complexe semantische concepten. Zo kan een computer bijvoorbeeld zelf leren hoe jihadistische propaganda eruit ziet, zonder dat we op voorhand moeten weten welke terminologie daarbij gebruikt wordt. Wat computers dan nog missen in accuraatheid en talig buikgevoel, maken ze ruimschoots goed door hun duizelingwekkende verwerkingssnelheid. En dat is geen overbodige luxe in een wereld waarin massa’s tekst wordt geproduceerd: duizenden publicaties per seconde op Twitter bevatten allemaal een zekere mate van kennis die we met taaltechnologie kunnen ontsluiten.

In elke situatie waarin je zelf geen vat kan krijgen op de hoeveelheid tekst die wordt geproduceerd, is taaltechnologie een onmisbare hulp. Taaltechnologie laat bijvoorbeeld toe om gerichte interventies te plannen tijdens natuurrampen of om de organisatie van grote evenementen te stroomlijnen op basis van nieuwsartikelen, social media content of e-mails. De commerciële toepassingen zijn dan ook legio. Zo gebruikt Dell automatische sentiment analyse om hun prijszetting te bepalen: een laptop met goede reviews en social media buzz zal minder snel afgeprijsd worden dan eerder lauw onthaalde modellen.

Mensen zijn immers niet karig met hun opinies op sociale media en de gegevens die je via text mining op sociale media kan verzamelen zijn dan ook erg waardevol: je verzamelt immers gegevens zonder mensen lastig te vallen en op het moment dat ze een mening hebben gevormd, dit in tegenstelling tot de traditionele enquêtevorm. En het is zelfs mogelijk om met taaltechnologie te achterhalen of die meningen.

Maar we kunnen ook nog verder gaan dan de tekst zelf. Een van de meest tot de verbeelding sprekende toepassingen van taaltechnologie is auteursprofilering: op basis van iemands schrijfstijl kan je immers een heleboel verborgen demografische aspecten achterhalen: zijn/haar leeftijd, geslacht of opleidingsniveau, maar ook persoonlijkheidskenmerken zijn automatisch te herkennen in iemands schrijfstijl. De combinatie van sentiment analyse en automatische auteursprofilering laat dan toe om opinies te linken aan bepaalde demografische groepen, zonder dat je hierbij de privacy van het individu zelf schendt.

Volledig taalbegrip ligt voor computers nog niet binnen handbereik, al zorgen recente ontwikkelingen binnen het deep learning paradigma voor een indrukwekkende stroomversnelling. Als een van de meest uitdagende takken van de kunstmatige intelligentie, blijft computerlinguïstiek in elk geval tot de verbeelding spreken.

Wie graag hands-on wil gaan met taaltechnologie, nodigen we uit om onze web services uit te proberen. Ook kan je je schrijfstijl laten analyseren in onze on-line demo. We zijn in elk geval benieuwd naar jullie ervaringen.

Guy De Pauw is als postdoctoraal onderzoeker verbonden aan het CLiPS onderzoekscentrum van de Universiteit Antwerpen. Hij werkt voor het AMiCA-project dat onderzoekt hoe taaltechnologie de veiligheid van kinderen op sociale media kan vrijwaren. Guy is ook CEO van Textgain, een recente spin-off van de Universiteit Antwerpen, die state-of-the-art taaltechnologie naar de markt brengt.

En als je je afvraagt of jouw bedrijf baat kan hebben bij toepassingen met NLP denken wij bij Foursevens graag met je mee, je kan dan ook ineens kennismaken met onze NLP-gedreven AI assistente Julie: info@foursevens.be.

Categorieën
Article

Technology in the classroom: time to experiment!

Yesterday I was invited to share my views on technology in the classroom to a group of 25 educational experts. Here’s a brief overview of some of the topics.

Experience based learning

The biggest impact technology can have in teaching is by creating a realistic environment. We learn faster and better in an environment that gives us lots of stimuli and lots of useful feedback on our interactions with the new material.

the circular learning process

I introduced my audience to examples of experience based learning like the collaboration between English students in Brazil and people at a retirement home in the US. You can watch that moving story here. It gives me goose bumps every time I watch it!

I also made them remember their geography classes and presented how that class would never be the same again thanks to a smart sandbox (https://www.youtube.com/watch?v=j9JXtTj0mzE) and we watched how augmented reality could help electronics students work and learn at their own pace. We also looked at the power of artificial intelligence and the effect it has on small children in Cognitoys.

Virtual reality

And then I really got out the big surprises when we watched virtual reality, thanks to a Google Cardboard and the fabulous virtual reality documentaries of VRSE. Having never experienced virtual reality before, it had a stunning effect on them.

Inspire and experiment

I hope these examples inspire people. Give them ideas on how much more realistic an environment we can create thanks to technology. These examples show how a lot of things can be done, today, with readily available hardware and experimental software. Because this is the time for experimenting. So many things are being invented that could be turned into learning experiences. Today no one has a ready answer on how to integrate these in a school environment and curriculum. Therefore it is up to everyone in education to experiment and learn. If there was ever a time to do crazy stuff; this is the time!

Categorieën
Article

Ik ga op reis…

Wat is dat eigenlijk, de blockchain? Ik kreeg de vraag vorige week en dacht me daar even makkelijk vanaf te maken. Daar bestaan toch al duizenden filmpjes over? Een snelle zoektocht op Youtube bracht de conclusie: mijn vraagsteller gaat met geen enkel van deze filmpjes verder komen. Ofwel veel te vaag, of te technisch of gewoon ultra-incrowd-technees.

Dus dan maar zelf; blockchain uitleggen op een manier dat je nooit meer vergeet wat blockchain is.

Je kent het spelletje ‘Ik ga op reis en ik neem mee’? Omdat je het vroeger zelf speelde en omdat je er nu soms je kinderen zoet mee houdt tijdens lange autoritten. In dat spelletje gebeurt het volgende;

  • de eerste deelnemer zegt een ding
  • de volgende herhaalt wat de vorige deelnemer zei en voegt daar een ding aan toe
  • alle volgende deelnemers herhalen de hele hoop dingen van alle vorigen en voegen telkens iets toe

In het spelletje is het belangrijk dat de juiste dingen herhaald worden en dat ze in de juiste volgorde herhaald worden. Doordat iedereen meeluistert kan elke deelnemer detecteren wanneer iemand een fout maakt. Die fout kan een verkeerd ding zijn of een ding dat op de foute plaats in de volgorde vermeld wordt.

En dat is precies wat blockchain doet. In plaats van een centraal ‘geheugen’ met blokken informatie te maken, wordt deze informatie verspreid over een groot aantal ‘deelnemers’. Elke deelnemer in het netwerk heeft dezelfde informatie, namelijk blokken informatie en een volgorde waarin die opgeslagen werden. Zowel de blokken als de volgorde zijn versleuteld en kunnen niet veranderd worden. Dat heet Distributed Ledger en is het principe waarop Blockchain gebouwd werd.

‘Ik ga op reis’ gebeurt natuurlijk in een voor iedereen begrijpelijke en hoorbare taal. Blockchain is echter ook een beveiligd en versleuteld systeem. Wanneer er nieuwe informatie in het systeem wordt aangeboden, moeten een aantal deelnemers checken of dit strookt met hun informatie en vervolgens hun akkoord geven. Een deelnemer geeft goedkeuring door een sleutel vrij te geven. Verschillende sleutels samen vormen de toegang, de nieuwe informatie kan worden toegevoegd aan de blockchain. Als iemand een deelnemer probeert uit te schakelen, kunnen de nodige sleutels niet meer verzameld worden en is er geen toegang.

Neem nu een testament. Wanneer ik heb beslist dat mijn vleugelpiano* na mijn dood geschonken moet worden aan het beloftevolle zoontje van de buren kan mijn zus* niet prutsen aan mijn testament. Mijn testament en identiteit is namelijk versleuteld opgeslagen op alle computers in het netwerk van de testament-blockchain*. Het hele netwerk kent mijn testament en weet dat ik de eigenaar ben. Als er aan mijn testament iets moet worden aangepast, kijkt het hele netwerk toe om te verzekeren dat ìk een nieuwe versie van mijn testament toevoeg. Als iemand anders dat zou proberen roepen de deelnemers ‘neen’!. Mijn zus zou bijgevolg alle computers in de testament-blockchain tegelijkertijd moeten hacken om ooit iets aan te passen. En dat is onmogelijk.

Met andere woorden, de blockchain is een digitale en versleutelde vorm van ‘ik ga op reis en ik neem mee’!  Precies daarom zal ze een rol kunnen spelen in omgevingen waar centraal beheer en controle van transacties traag en duur is en waar beveiliging van data een zeer belangrijke rol spelen. Denk dus niet alleen aan digitaal geld maar zeker ook aan energie productie tov verbruik, transacties van vastgoed, aandelenverkeer, etc.

*ik bezit alleen in mijn dromen een vleugelpiano
*er bestaat nog geen testament-blockchain
*mijn zus zou zoiets nooit doen want ’t is een lieve

Categorieën
Video

Leenke De Donder over Data visualisatie

Mensen zijn eigenlijk gemaakt om naar data visualisatie te kijken. Leenke De Donder, data visualiste bij Foursevens, vertelt over leeuwen achter gras en de boeiende mogelijkheden van data visualisatie in een data-driven wereld.

Categorieën
Article

Tailor made is great for suits.

About 4 years ago I was working as a business analyst at a large financial company. They were planning to build a monster. The monster would consist of a top market CMS buried beneath a pile of customization. Because surely a large organisation has its very own incredibly specific needs when it comes to managing content.

webmasterempire

At the time I fought this plan with every piece of ammunition I could find. It was the time I started using sketches to explain technical stuff to non-technical people. I explained the business what path they were starting to walk and where it would lead. How expensive content management systems evolve. And how, as a customer, the only way you can get something out of this massive investment is to keep the pace of product updates. Unfortunately most product customizations make updates difficult. In this case the customizations would make updating impossible. And your investment would be dead and useless in about a year.

I lost my battle. The decision was made higher up in the organisation. They bought the product and started the customization. (I left and created Foursevens.) We are now 4 years (!) later. The first website (!) on the new CMS is about to go live. The CMS product has recently been acquired by a company known to kill most products as soon as support contracts end. The financial company has decided to abandon the CMS. I can only begin to imagine the scale of the investment they have done in the last 4 years. Leading nowhere.

kleerkastKlein

So let’s face it;

  • most companies have content needs that are VERY SIMILAR to most other companies, however unique your company might be. That is why off-the-shelf CMS systems exist.
  • the commercial stories around CMS systems are notoriously optimistic and couldn’t be further from reality, you can’t base a purchase on them
  • the decision to create customizations needs to be evaluated, reevaluated and reevaluated
  • customizations that block a product from updating are a place you don’t want to go

In every technology choice you ever make, the first question really needs to be: does it already exist and can I buy it. If you consider a CMS but your adaptation is going to cost more than the CMS itself, ask yourself whether you have fully understood your business needs. Cause at the end of the day you buy a system that needs to help your content people to get websites published, updated and serving customers needs. Involve those content people as much as possible as soon as possible before making a choice. And don’t let anyone ever tell you tailor made software is always the best choice.

Categorieën
Article

You need a war room!

War Rooms v2.0

In the past, war rooms were strategic places in army camps where the decision makers had the tools and information to decide their military movements and actions, as we can see in movies like Dr. Strangelove, or more recently, in Game of Thrones.

While the context of use of a “war room” has changed since then, the concepts and impacts of using one remain the same. They rely on three big pillars that will become the foundations to build successful projects in your company:

  1. Dedicated place
  2. Key information sharing
  3. Organised and direct collaboration

Dedicated place

Neither an unused office nor a meeting room; a war room has to be a specific place that will only be dedicated for projects (one at a time) and/or missions around them.

It is important that teams take ownership of the room and make full use of the available space. A key characteristic of a war room is that every surface should be usable: walls are whiteboards and/or full of post-its, posters or any interesting content. This is spacialisation: to externalise minds and ideas in order to get them “physically available to touch, see, organise” (Invisionapp, 2016).

On this basis and thanks to the fact that it is editable — ideas are not frozen —, a war room is a room-sized communication tool that promotes making new connections as well as finding new insights and generating problem solutions.

Key information sharing

Due to its accessibility, the war room should become a controlled source of information for every person involved in the project. It will be the communication center not only for teams, but also for leaders, contributors, and stakeholders. It will allow posting and keeping record of key aspects of the project “that may include change notices, requests for immediate actions and/or decisions, general status updates” (Williams, 2015). That is the basis of an organised collaboration that allows teams to adapt quickly and efficiently.

Organised collaboration

Gathering everybody in the same location and getting everyone on the same page has a lot of benefits. Knowing what everyone is doing and allowing direct communication will boost creativity, honesty, and promote helping each other. It will also improve confidence, team commitment, and give a feeling of shared responsibility.

Access to information will provide team knowledge and result in well-informed decision making.

Additionally, even if a war room has to be considered like a place where classical hierarchy doesn’t matter, it can be very useful to designate a facilitator. That person will act as the conductor, who the team can rely on. Her/his role will be to master all the information, clearly define the goals of each session, keep everyone on task, and set directions when needed.

In short, organised collaboration will result in optimising the iteration process (less wasted work), the efficiency and the working speed of the teams.

How to setup your war room?

Now that we have seen the benefits of hosting a war room in your company, and that you have assigned a dedicated room to it, here are three guidelines to make it real:

  1. Maximise your space: install whiteboards, chalkboards, use walls themselves (pin-it information and/or paint them with Ideapaint, flipcharts, post-its, and keep them up-to-date — add in all new or updated information.
  2. Make changes: use flexible furniture and open seating so that you can transform your space quickly, and add some mess into the room — let the wild creativity get inside it.
  3. Use it!: as long as you need it, and “only exit the room with clear responsabilities and accountabilities for next steps” (Wodtke, 2015).

Now, give it a chance, encourage people to use it, and let your projects reach another dimension. Would you like to give a war room a try, contact us, we’ve got a plan cooking!

Categorieën
Article

The hackathon way of learning.

NOT

Categorieën
Article

Het einde van bezit

Het is een feit, elke uitzending van VPRO tegenlicht is de moeite waard om even alles voor stil te leggen (niet in het minst je smartphone). Maar in deze uitzending kom je te weten hoe het omvormen van producten naar services een enorme impact kan hebben op de duurzaamheid van onze economie. Vergeet even hoe onze consumptiemaatschappij vandaag functioneert en laat je onderdompelen in hoe het ook zou kunnen.

Bekijk hier de aflevering op de website van VPRO.

Categorieën
Article

Blockchain in de overheid

De stad Antwerpen werkt actief samen met Vlaanderen om met behulp van blockchain technologie efficiënter bestuur te realiseren. Tal van buitenlandse overheden zijn er al een tijdje mee bezig. Dat is niet verwonderlijk. Blockchain technologie kan leiden tot minder administratieve rompslomp, meer transparantie en minder kans op fraude. Het klinkt aanlokkelijk. Maar tegelijkertijd bestaat er over Blockchain heel wat verwarring en komt er ook veel hype bij kijken.

Dus tijd om het over een paar basisprincipes te hebben, zo dachten we.

Kerntaak van de overheid

Eén van de kerntaken van overheden is het registreren van transacties, van huwelijk tot de aankoop van een huis, van het betalen van onroerende voorheffing tot het vervullen van de stemplicht. Blockchain kan daar bij helpen.

Want met blockchain kan iedereen ervan uitgaan dat wat er bijgehouden wordt, altijd accuraat is. En met iedereen bedoelen we iedereen die bij de transactie betrokken partij is.

Neem nu de aankoop van een huis als voorbeeld. Eigenlijk is de aankoop van een huis een opeenvolging van handelingen door de verkoper, de makelaar, de koper, de bank, de notaris en de overheid. Elk van die handelingen bewaren we liefst chronologisch en eenmaal opgeslagen willen we niet dat er nog iets kan wijzigen. Als het compromis getekend is en de bank nadien zijn akkoord heeft verleend, kan de aankoop bij de notaris doorgaan.

Blockchain is een gedeelde database waar verschillende partijen transacties kunnen aan toevoegen. Niet enkel de transactie zelf wordt versleuteld – aankoop bij de notaris – maar ook de transactie die daaraan vooraf ging – bank heeft akkoord verleend.

Geïnteresseerd in meer? Hier kan je de volledige paper lezen en downloaden. kan je de volledige paper lezen en downloaden.