Deze "frankentelefoon" is het geheim van de portretmodus van Pixel 3 (foto)

Ginder portret-modus van de google-pixel vorig jaar beroemd geworden door er een te combineren neuraal netwerk en fasedetectie-autofocus (PDAF)-informatie om te bepalen welke pixels in de foto het onderwerp op de voorgrond zijn en welke deel uitmaken van de achtergrond. Dit alles om een ​​goed Bokeh-effect te krijgen, zelfs met de kleine sensoren in een smartphone, en je kunt eigenlijk zeggen dat de missie is volbracht. Ten minste gedeeltelijk.

De portretmodus van de Pixel 3 heeft een aantal stappen vooruit gezet, waarbij de mogelijke bugs van het vorige model zijn verholpen en andere zijn toegevoegd aan de informatie die tot nu toe is gezien.”sporen“in de scherptediepte van de scène.

Punten die het verst van uw onderwerp op de voorgrond verwijderd zijn, zijn bijvoorbeeld al minder gedefinieerd dan de punten die zich het dichtst bij u bevinden, en dit kan helpen om ze beter van elkaar te scheiden. Door de geschatte grootte van veelvoorkomende objecten te kennen, kan het aantal pixels waaruit die objecten op de foto bestaan, nauwkeurig worden gebruikt om hun afstand te schatten.

  

Ja, deze “semantische aanwijzingen” zijn een reeks extra complicaties waarmee Google rekening moet houden bij het verwerken van de kaart, om een ​​meer verfijnde dieptekaart te hebben, en dit is helemaal niet eenvoudig.

Om dit proces te vereenvoudigen, machine learninghet trainen van een convolutief neuraal netwerk, geschreven in TensorFlow, dankzij een “frankentelefoon” bestaande uit 5Pixel 3 “versmolten” met elkaar. Op deze manier werden 5 foto’s tegelijk genomen (met een tolerantie van ongeveer 2 milliseconden) van hetzelfde onderwerp onder iets verschillende hoeken, om het neurale netwerk te trainen met foto’s die vergelijkbaar zijn met de foto’s die gebruikers vaak maken met hun smartphones (in het voorbeeld een meisje, maar we weten niet hoeveel verschillende scènes Google heeft gebruikt).

Er zit zeker veel werk achter zoiets, zo erg zelfs dat je je afvraagt ​​of het echt de moeite waard is en of er geen hardware-oplossingen zijn om dingen te vereenvoudigen. EEN grootste sensor Het zou inderdaad veel kunnen helpen, maar het is de grootte van de smartphones zelf die een onoverkomelijke beperking is, en het werk dat Google doet wordt elk jaar beter.

Om de geboekte vooruitgang te waarderen, kunt u dit album bekijken in Google Foto’s of een klein fragment in de galerij hieronder. Het verschil tussen “stereo” en “geleerde” beelden (d.w.z. met behulp van de hierboven genoemde machine learning) is duidelijk en dient ook om de grenzen van de techniek die in de Pixel 2 wordt gebruikt te illustreren. Voor meer technische details verwijzen we u naar de link naar de bron.

0 Shares:
You May Also Like
Read More

TOP 7 AirPods 3-chips

We wachten al een jaar op de bijgewerkte AirPods 3. En uiteindelijk wachtten ze. De nieuwigheid werd getoond…