Questo articolo è riprodotto dall'account pubblico WeChat: Sig. Sai. Autore originale: Gu Xianfeng è professore ordinario presso la Stony Brook University della State University di New York, professore ospite presso il Qiu Chengtong Mathematical Sciences Center della Tsinghua University e fondatore della geometria conforme computazionale. Il 2 febbraio, Magic Leap ha annunciato ufficialmente di aver ricevuto circa 794 milioni di dollari in finanziamenti guidati da Alibaba Group. Considerando il precedente round da 542 milioni di dollari guidato da Google, la società ha completato un investimento totale di 1,34 miliardi di dollari dalla fine del 2014, con una valutazione complessiva di circa 4,5 miliardi di dollari. Questa startup con sede in Florida è attiva da decenni e vanta una gamma di prodotti di lusso e un'attività su larga scala, ma è estremamente riservata riguardo alla sua tecnologia di base. Di tanto in tanto, sono trapelati alcuni video dimostrativi che hanno stupito il mondo e causato scalpore. Qual è dunque lo straordinario segreto tecnologico di Magic Leap? Qui Lao Gu avanza audaci speculazioni, cercando di esplorare l'essenza della tecnologia dietro il suo aspetto confuso. Figura 1. Una balena gigante salta fuori dal centro del campo da basket! Figura 2. Trasforma il tuo ufficio in un campo di battaglia per videogiochi! Nel campo della computer grafica, l'evoluzione della tecnologia di dimostrazione del rendering di scene tridimensionali può essere grossolanamente suddivisa nelle seguenti fasi storiche: macchina fotografica a foro stenopeico, visione stereo binoculare, campo luminoso e olografia digitale. In breve, il lavoro rappresentativo della tecnologia dimostrativa della fotocamera a foro stenopeico è il primo film d'animazione "Final Fantasy", il lavoro rappresentativo della visione stereoscopica binoculare è la versione 3D di "Avatar", il lavoro rappresentativo del campo luminoso è Magic Leap e il lavoro rappresentativo della tecnologia olografica digitale sono le scene di "Star Wars". Figura 3. Final Fantasy: rendering Ray Tracing, tecnologia di visualizzazione della fotocamera stenopeica. Figura 4. Versione 3D di "Avatar", visione stereoscopica binoculare. Figura 5. Magic Leap, realtà aumentata, tecnologia del campo luminoso. Figura 6. Star Wars, olografia digitale. Magic Leap ha realizzato e diffuso la tecnologia di visualizzazione a campo luminoso, che rappresenta una vera e propria rivoluzione nella tecnologia di visualizzazione di scene tridimensionali. È naturale che abbia ricevuto investimenti senza precedenti. Cos'è quindi un campo luminoso? Questa tecnologia è completamente nuova? Qual è il contesto storico dello sviluppo di questa tecnologia? Ci sono altre aziende che hanno iniziato con la tecnologia del campo luminoso? Di seguito ne spiegheremo ciascuno. Fotocamera a foro stenopeico Il modello ideale di una macchina fotografica ottica tradizionale è la macchina fotografica a foro stenopeico. Nella computer grafica, i metodi di rendering tradizionali si basano su questo modello di telecamera. Come mostrato nella FIG. 7, un raggio viene emesso dal centro ottico della fotocamera attraverso ciascun pixel dello schermo di imaging. Il ray tracing sfrutta le leggi fisiche dell'ottica geometrica per calcolare il colore del raggio, che è il colore del pixel corrispondente. La figura 8 mostra un'immagine renderizzata elaborata utilizzando il metodo del ray tracing. Qui abbiamo bisogno di una trasformazione concettuale. Ogni pixel non è un punto, ma un raggio. Questa è la chiave per comprendere il campo luminoso! In altre parole, una fotografia è un insieme di raggi che attraversano il centro della luce. Final Fantasy è stato renderizzato utilizzando il tracciamento ottico. Figura 7. Modello di fotocamera stenopeica nel ray tracing. Figura 8. Una scena renderizzata utilizzando il ray tracing. I metodi di visualizzazione tradizionali, come gli schermi LCD/LED, si basano sul concetto tradizionale secondo cui ogni pixel è considerato un punto e il colore dello stesso pixel rimane invariato se osservato da diverse angolazioni. In altre parole, questo metodo di visualizzazione perde le informazioni sulla direzione del raggio. Visione stereo binoculare Gli esseri umani hanno due occhi. Quando si guarda un oggetto, ciascun occhio forma un'immagine. Il cervello calcola le informazioni sulla profondità di ogni punto in base alle sottili differenze nelle immagini formate dai due occhi, ottenendo così una sensazione tridimensionale. Imitando l'occhio umano, possiamo utilizzare una macchina fotografica a doppia lente per ottenere foto stereoscopiche binoculari. Figura 9. Telecamera stereo binoculare. Figura 10. Foto stereoscopiche binoculari scattate durante il programma di allunaggio Apollo. In sostanza, una fotografia stereoscopica binoculare è composta da due raggi che originano da due centri ottici. La versione 3D di "Avatar" è stata prodotta basandosi su questo principio. Rispetto a una fotocamera monoculare, la complessità temporale e spaziale della visione stereo binoculare sono doppie. Campo di luce - Spiegazione della scatola magica Figura 11. Spiegazione della scatola magica del campo luminoso. Supponiamo di coprire un coniglio con una scatola di vetro e poi di osservare il coniglio attraverso la scatola di vetro. Da qualsiasi punto della superficie della scatola viene emesso un raggio in qualsiasi direzione nello spazio tridimensionale. Il colore di questo raggio è determinato dal coniglio e dalle condizioni di illuminazione. Noi usiamo Per rappresentare la scatola di vetro, rappresenta un vettore unitario e un raggio è rappresentato da , l'insieme di tutti i raggi è indicato come . Ogni raggio corrisponde a un colore, che rappresentiamo con un punto nello spazio tridimensionale. . Pertanto, un campo luminoso è una mappatura dallo spazio dei raggi allo spazio colore. In altre parole, un campo luminoso è una funzione a valori vettoriali definita nello spazio dei raggi: . Supponiamo di rimuovere il coniglio dalla scatola di vetro, ma questa scatola di vetro è una scatola magica e le informazioni del campo luminoso sono perfettamente conservate. Quando osserviamo questa scatola magica, tutti i raggi che passano attraverso un occhio si combinano per formare un'immagine sulla retina. Possiamo modificare liberamente la distanza e l'angolo di visione e l'immagine del coniglio sulla retina cambierà naturalmente di conseguenza, quindi non noteremo affatto la scomparsa del coniglio. Quindi, con la scatola magica, non abbiamo più bisogno di un vero coniglio. Questa scatola magica è il campo luminoso del coniglio. Nel campo dell'ottica, il campo luminoso è un concetto vecchio. È stato introdotto nel campo della computer grafica da studiosi di Microsoft e Stanford nel 1996, e sono passati vent'anni dal suo sviluppo nel 2016. Sebbene le persone nel mondo accademico abbiano lavorato instancabilmente per approfondire la loro ricerca, è stato solo negli ultimi anni che si è avuto un impatto reale nell'industria. Magic%20Leap dovrebbe essere considerato l'apice della teoria del campo di luce nelle applicazioni pratiche. Rendering del campo luminoso% Possiamo usare il campo luminoso del coniglio per sostituire il coniglio, eseguire il rendering e generare foto da diverse angolazioni, in modo da non dover costruire il modello geometrico, il modello di texture e il modello di illuminazione del coniglio. Per scene di grandi dimensioni, condizioni di illuminazione complesse o modelli geometrici complessi (come i peluche), i campi di luce sono più semplici dei modelli digitali di oggetti fisici oppure sono più realistici o più efficienti dei risultati di rendering ottenuti tramite ray tracing, per questo utilizziamo i campi di luce per il rendering. Questo è il cosiddetto metodo di rendering basato sulle immagini (%20Image%20Based%20Rendering%20). Storicamente, Microsoft ha rilasciato un gioco basato su un campo di gioco leggero, simile a Deserted Island Treasure Hunt. Tutte le scene sono state raccolte dalla natura reale ed erano molto realistiche, ma alla fine non hanno suscitato alcuna risposta e si sono concluse invano. Acquisizione del campo luminoso: il campo luminoso è una funzione definita nello spazio dei raggi, che è quadridimensionale. Le tradizionali fotocamere stenopeiche possono acquisire solo cluster di raggi bidimensionali, quindi l'acquisizione del campo luminoso è intrinsecamente difficile. I primi metodi di acquisizione del campo luminoso erano semplici e rudimentali, e utilizzavano array di telecamere su larga scala, come l'array di telecamere bidimensionale mostrato nella Figura 12. Tali telecamere a campo luminoso sono ingombranti e costose, il che le rende difficili da ottenere su larga scala. Figura 12. Fotocamera a campo luminoso di Stanford: array multi-camera 16x8. Con l'avanzare della tecnologia delle fotocamere digitali, le fotocamere stenopeiche stanno diventando sempre più piccole e possono essere integrate tra loro, riducendo così le dimensioni delle fotocamere a campo luminoso. Tuttavia, le dimensioni della lente non possono essere ridotte, come mostrato nella Figura 13. Fig. 13. Stanford Light Field Camera: serie di telecamere. La vera svolta è arrivata dalla biomimetica. Molti insetti hanno occhi composti, che acquisiscono informazioni sul campo luminoso. Fig. 14. Occhi composti di insetti: telecamere a campo luminoso. Gli esseri umani imitarono gli insetti e crearono delle lenti simili agli occhi composti, come mostrato nella Figura 15, che integra decine di piccole lenti su una lente più grande. Grazie al miglioramento della tecnologia ottica, sono state create migliaia di minuscole lenti integrate su una pellicola di plastica. Basandosi su questa idea, Wu Ren, dottorando di Stanford, ha fondato l'azienda di fotocamere a campo luminoso Lytro. Figura 15. Prototipo di occhio composto artificiale realizzato da Adobe. Le fotocamere tradizionali richiedono la messa a fuoco prima di scattare una foto. Lo slogan della fotocamera Lytro è "prima scatta la foto, poi metti a fuoco". Grazie alle informazioni sul campo luminoso ottenute dalla fotocamera Lytro, gli utenti possono sintetizzare foto 4D da diverse angolazioni e profondità a partire dal campo luminoso 4D. Figura 16. Fotocamera Lytro. Fotografia di matrimonio come mostrato nella Figura 17: Nella stessa foto con campo luminoso, possiamo mettere a fuoco lo sposo che è vicino alla macchina fotografica; possiamo anche concentrarci sulla sposa che è lontana dalla telecamera. Figura 17. Foto di matrimonio realizzata con Lytro: la stessa foto con campo luminoso può essere messa a fuoco su aree diverse. Riquadro a sinistra, messa a fuoco sullo sposo; inquadratura a destra, messa a fuoco sulla sposa. Il metodo di visualizzazione tradizionale del display a campo luminoso, schermo LCD/LED, conserva solo le informazioni geometriche e le informazioni sul colore del punto di intersezione in cui il raggio attraversa lo schermo, ma non conserva le informazioni sulla direzione del raggio. Lo schermo è diffusamente riflettente e tutti i raggi emessi da un certo punto sullo schermo sono dello stesso colore, mentre la visualizzazione a campo luminoso richiede che i diversi raggi che partono dallo stesso punto abbiano colori diversi, come mostrato nella FIG18. La tecnologia alla base di Magic Leap è la visualizzazione a campo luminoso. Figura 18. Confronto delle modalità di visualizzazione: l'immagine a sinistra è uno schermo tradizionale, in cui tutti i raggi che passano attraverso un punto sono dello stesso colore; l'immagine a destra è un display a campo luminoso, in cui i diversi raggi che attraversano un punto hanno colori diversi. Display a campo luminoso della USC La University of Southern California ha proposto e prodotto un dispositivo di visualizzazione a campo luminoso, come mostrato nelle Figure 19 e 20. C'è una vetrina con quattro lati che trasmettono la luce. Al centro del mobile c'è uno specchio con un angolo di 45 gradi rispetto al piano orizzontale. Nella parte superiore del mobile è installato un proiettore ad alta velocità. Il proiettore proietta verticalmente verso il basso e la luce viene riflessa dallo specchio e poi emessa orizzontalmente. Contemporaneamente lo specchio ruota ad alta velocità. Una testa trasparente e spettrale era sospesa nell'aria. Mentre camminavamo intorno alla credenza, potevamo vedere tutti i lati della testa, che ci ammiccava. Figura 19. Display luminoso dell'USC, una testa umana fluttuante. Figura 20. Display USC Light Field per sistema di teleconferenza. Figura 21. Disegno del brevetto del display USC Light Field. La FIG21 mostra il principio di questo strumento di visualizzazione del campo luminoso. Lo specchio inclinato di 45 gradi (114) viene azionato per ruotare dal motore (115) e il processore grafico (130) genera un'immagine e la trasmette al proiettore ad alta velocità (120). Il proiettore proietta l'immagine sullo specchio, che viene poi riflessa e proiettata orizzontalmente in tutte le direzioni. In questo modo, dopo un rigoroso controllo di sincronizzazione, visualizziamo un campo luminoso tridimensionale. Il dispositivo è ingombrante e costoso e lo specchio rotante ad alta velocità rende il sistema meno stabile. Qualsiasi vibrazione meccanica influirà sull'effetto di visualizzazione del campo luminoso. Magic Leap Light Field Display - Spiegazione della torcia elettrica La tecnologia di base di Magic Leap è uno speciale dispositivo di visualizzazione del campo luminoso: il proiettore a fibra ottica. Il laser si propaga nella fibra ottica e viene emesso dalla porta in fibra, con la direzione di uscita tangente alla fibra. Modificando la forma della fibra nello spazio tridimensionale, in particolare modificando la direzione tangente all'estremità della fibra, possiamo controllare la direzione dell'emissione laser. È come se tenessimo in mano una torcia e cambiassimo la direzione del fascio luminoso in uscita cambiando la posizione e la direzione della torcia. Se scuotiamo rapidamente i polsi, il raggio di luce della torcia disegna un cono nell'aria, che a sua volta colpisce un muro formando un cerchio. Modificando rapidamente l'ampiezza del movimento del polso, possiamo controllare il raggio del cerchio, ottenendo così una serie di cerchi concentrici che ricoprono un disco. Se il colore del fascio luminoso della torcia cambia, abbiamo disegnato un disco colorato sul muro. Quindi, agitando rapidamente una torcia elettrica, otteniamo un'immagine, o sovrapposizione di raggi. Supponiamo che ci siano molte persone in piedi in diverse posizioni nello spazio e che ognuna di loro agiti una torcia: in questo caso otteniamo un campo luminoso. Ecco come funziona il dispositivo di visualizzazione del campo luminoso di Magic Leap: un proiettore a fibra ottica. Figura 22. La torcia di Magic Leap. FIG22 mostra la torcia di Magic Leap. L'attuatore (206) è equivalente al polso umano e la fibra ottica (208) è equivalente alla torcia elettrica. L'attuatore fa vibrare periodicamente la punta della fibra, che disegna a spirale una serie di cerchi concentrici. Il laser viene emesso attraverso il sistema di lenti, disegnando un gruppo di raggi nell'aria. La proiezione sul piano illumina un disco. Modificando in modo sincrono il colore e l'intensità di una fibra, si ottiene un'immagine utilizzando la tecnologia time-sharing, come mostrato nella Figura 23. Figura 23. Una fibra produce un'immagine utilizzando la tecnologia time-sharing. Nel proiettore di luce a fibre ottiche di Magic Leap ci sono molte fibre ottiche assemblate in una matrice bidimensionale. Ogni fibra equivale a una macchina fotografica a foro stenopeico e la matrice bidimensionale della telecamera genera un campo luminoso. Vantaggi della visualizzazione a campo luminoso Rispetto alla visione stereo binoculare, la visualizzazione a campo luminoso presenta numerosi vantaggi. Gli esseri umani possono ottenere informazioni tridimensionali sulla profondità in due modi: "forma da stereo" e "forma da messa a fuoco". Utilizziamo due occhi per vedere lo stesso oggetto e lo stesso punto nello spazio tridimensionale viene proiettato su pixel diversi sulla retina sinistra e destra. Il nostro cervello umano può utilizzare i pixel sulla retina per calcolare inversamente i raggi spaziali corrispondenti, ottenendo così l'intersezione dei due raggi e ricavando informazioni sulla profondità. Questo processo è chiamato "forma da stereo". Quando ciascuno dei nostri occhi guarda un oggetto, il cervello regola automaticamente la curvatura del cristallino in modo che l'oggetto venga visualizzato chiaramente sulla retina. Regolando la tensione dei muscoli del cristallino, il cervello riesce a calcolare la profondità degli oggetti, la cosiddetta "forma a partire dalla messa a fuoco". Quando abbiamo guardato la versione 3D di "Avatar", abbiamo utilizzato solo "forma da stereo". La lunghezza focale degli occhi era sempre fissa perché la distanza tra gli occhi e lo schermo non cambiava, quindi non c'era alcun processo di "forma dalla messa a fuoco". Tuttavia, dopo un lungo periodo di evoluzione umana, questi due processi sono diventati naturalmente strettamente collegati. Se li separi artificialmente, la gente sarà frastornata. Al contrario, se utilizziamo la tecnologia di visualizzazione a campo luminoso, abbiamo bisogno sia della "forma da stereo" che della "forma da messa a fuoco" allo stesso tempo, quindi non ti sentirai stordito durante la visione. La tecnologia di visualizzazione a campo luminoso è più naturale e salutare. Le sfide dei display a campo luminoso Essendo l'inizio di una rivoluzione, la tecnologia di Magic Leap deve affrontare numerose sfide. La spiegazione più diretta è questa: la tecnologia di visualizzazione tradizionale deve calcolare solo una fetta bidimensionale nel campo luminoso quadridimensionale, mentre la visualizzazione del campo luminoso deve calcolare l'intero campo luminoso quadridimensionale e la sua complessità computazionale aumenta di diversi ordini di grandezza. Questo è uno dei colli di bottiglia tecnici. Allo stesso tempo, è necessaria una tecnologia incredibile anche per un controllo preciso dei componenti meccanici, in modo che ogni fibra vibri in modo stabile e naturale, che il modello di vibrazione sia sincronizzato con la trasmissione dei dati e che la vibrazione non sia influenzata da rumori esterni. Sono trascorsi vent'anni da quando il concetto di campo luminoso olografico digitale è stato proposto alla frenesia di investimenti di Magic Leap, e la storia dello sviluppo della tecnologia olografica digitale è ancora più lunga. Il campo luminoso è essenzialmente ottica geometrica, mentre l'olografia digitale è ottica ondulatoria. Attualmente la tecnologia olografica digitale sta diventando sempre più matura. Con l'invenzione del laser blu, è diventata possibile la tecnologia olografica digitale a colori. Gli attuali colli di bottiglia nello sviluppo sono: innanzitutto, la quantità di calcoli è enorme e supera di gran lunga il calcolo del campo luminoso; in secondo luogo, il display olografico digitale richiede un tipo speciale di cristallo e l'indice di rifrazione di ciascun pixel può essere controllato dalla tensione. Attualmente, tali ottiche sono ancora costose e di piccole dimensioni. Riteniamo che, man mano che la tecnologia basata sui campi luminosi verrà ampiamente accettata, anche l'olografia digitale si svilupperà rapidamente. Ispirazione dalla tecnologia dei campi luminosi Lo sviluppo storico della tecnologia dei campi luminosi ci mostra che le rivoluzioni tecnologiche dirompenti spesso hanno origine dalla scienza di base e dal mondo accademico non commerciale. Spesso ci vogliono decenni prima che un prodotto maturi in ambito accademico e diventi una forza da non sottovalutare nel mondo degli affari. La svolta tecnologica di Magic Leap deriva dall'impiego della tecnologia endoscopica, che dimostra l'importanza della ricerca scientifica transfrontaliera. Non vedo l'ora che arrivi il giorno in cui i film per la TV saranno girati con telecamere a campo luminoso e gli spettatori potranno scegliere dinamicamente l'angolazione di visione a loro piacimento. Forse dovremo aspettare altri vent'anni per arrivare a questo giorno, o forse ci vorranno solo tre o cinque anni. Credo che nel prossimo futuro tutte le foto su Taobao saranno sostituite da foto a campo luminoso e il casco Magic Leap diventerà l'equipaggiamento standard di ogni acquirente online. ( Questo articolo è stato pubblicato per la prima volta in "Lao Gu Talks Geometry" ed è riprodotto con il permesso dell'autore.) Vincitore del Qingyun Plan di Toutiao e del Bai+ Plan di Baijiahao, del Baidu Digital Author of the Year 2019, del Baijiahao's Most Popular Author in the Technology Field, del Sogou Technology and Culture Author 2019 e del Baijiahao Quarterly Influential Creator 2021, ha vinto numerosi premi, tra cui il Sohu Best Industry Media Person 2013, il China New Media Entrepreneurship Competition Beijing 2015, il Guangmang Experience Award 2015, il China New Media Entrepreneurship Competition Finals 2015 e il Baidu Dynamic Annual Powerful Celebrity 2018. |
<<: La pulizia dei denti rimuove lo strato protettivo dei denti? La verità è...
L'Organizzazione Mondiale della Sanità ha pub...
L'ingresso di acqua nell'olio motore dell...
Con l'arrivo del freddo, i nostri amici del s...
Crescere è un bellissimo desiderio di molti amici...
Wild 7 - Wild Seven - Valutazione completa e racc...
《La scienza popolare dei cotton fioc》 Wei Wenbin,...
Ciao a tutti, sono Helicobacter pylori. I miei an...
Mangiate zampe di maiale con le cipolle e mangiat...
Recensione e dettagli di "Shounen Ashibe GO!...
Dragon Ball DAIMA - L'inizio di una nuova avv...
All'inizio di quest'anno, lo scoppio impr...
Solo poche ore dopo che Apple ha annunciato il su...
Autore: Sun Qiang, primario, Peking Union Medical...
L’estate è calda e la lunga lotta contro le alte ...