Questa ondata di intelligenza artificiale sembra sbalorditiva, ma in realtà ci sono solo quattro possibili direzioni di atterraggio: innanzitutto, le innovazioni nella voce e nella semantica rendono finalmente possibile l'interazione vocale; in secondo luogo, le innovazioni nella visione artificiale hanno portato a metodi di visualizzazione come la realtà aumentata, che combinano spazio reale e spazio virtuale; in terzo luogo, le innovazioni nella visione artificiale consentono di potenziare l'automazione, dando vita a prodotti altamente automatizzati, come robot e automobili a guida autonoma; quarto, l'apprendimento automatico fornisce un nuovo modo di elaborare i dati. Per il modello imprenditoriale di base dell'ultimo tipo, fare riferimento all'articolo precedente: L'ispirazione imprenditoriale dell'intelligenza artificiale portata da due cose che Google DeepMind ha appena realizzato. I primi tre modelli imprenditoriali possono essere suddivisi in: serie di prodotti, da soft a hard e da hard a soft. Questo articolo esplora i pro e i contro di questi tre modelli. Serie di prodotti Le startup di intelligenza artificiale che conosciamo sono fondamentalmente basate su prodotti, come Mobvoi e Rokid Robotics in Cina e Jibo, Savioke, Knightscope, Meta, ecc. all'estero. La caratteristica fondamentale di questo tipo di startup è che cercano di sfruttare le innovazioni tecnologiche nell'ambito dell'intelligenza artificiale per creare nuovi prodotti con esperienze inedite (con interazione vocale o AR, ecc.) e generare interessanti curve di vendita. Quindi, cos'è una bella curva di vendita? Probabilmente sarà simile a questo: Una curva di vendita ottimale significa che una volta lanciato sul mercato un nuovo prodotto, la curva di vendita raddoppierà (probabilmente più di 2 volte) nei successivi tre anni, anziché aumentare lentamente del 10% all'anno. Ciò a sua volta significa che il periodo decisivo per queste startup è in realtà di soli tre anni. Non importa quanto hai fatto prima, se salti questi tre anni, tutto il tuo duro lavoro potrebbe rivelarsi inutile. Quanto tempo ci vorrà prima che il mercato decolli davvero da una fase iniziale? Nessuno lo sa. La tendenza può essere giudicata tramite deduzione logica, ma l'orario di inizio specifico è in realtà solo una supposizione cieca. Potrebbe essere 1 anno, 2 anni o anche 5 o 10 anni. In questo modo, ci sono solo due punti chiave che tutti gli imprenditori dell'intelligenza artificiale basata sui prodotti devono comprendere: 1. Effettuare preparativi adeguati durante un periodo di riscaldamento la cui durata non può essere chiaramente prevista, inclusi prodotti, canali di vendita, capacità di produzione e fabbricazione, ecc. 2. Una volta avviato il mercato, si produrrà la curva di vendita mostrata sopra. Se il primo punto non viene affrontato bene, sarà come Luo Yonghao e la sua Smartisan Technology. Se il secondo punto non viene affrontato bene, la situazione sarà come quella di alcune grandi aziende, come Motorola, che hanno tutto ma non riescono a fare nulla. Se entrambi gli obiettivi saranno raggiunti, sarà sicuramente una nuova azienda unicorno. È importante sottolineare che ciò che conta davvero nel raggiungimento dei due obiettivi sopra menzionati è l'esperienza del prodotto, non il progresso tecnologico. In altre parole, questo modello richiede persone come Steve Jobs, che sappiano usare bene la tecnologia, piuttosto che persone come Sergey Brin, che sappiano creare tecnologia. Anche se tutte le tecnologie appartengono ad altri, finché non influiscono sull'esperienza dell'utente, in realtà non ha molta importanza. Ma in realtà, poiché questa generazione di imprenditori dell'intelligenza artificiale è molto intelligente e ambiziosa, non vuole trasformarsi in pure aziende di assemblaggio; quindi queste startup solitamente cercano di concentrarsi su alcuni punti chiave della tecnologia nelle fasi iniziali, come l'ASR. Tra questi, il più estremo è Mobvoi. Secondo varie informazioni, Mobvoi avrebbe sviluppato il proprio ASR, NLU e persino la propria ricerca. Ciò significa che l'imprenditorialità basata sui prodotti è molto simile alla scalata del versante nord del monte Everest. Se ci riuscisse, sarebbe sicuramente una grande impresa, ma è estremamente difficile riuscirci. L'elevato rischio deriva da due aspetti: 1. La durata del periodo di riscaldamento è altamente imprevedibile. Tralasciando l'intelligenza artificiale, una delle aziende nazionali che ha utilizzato questo modello con maggiore successo finora è DJI. Le vendite di DJI hanno iniziato a decollare intorno al 2013 (non ci sono ancora dati ufficiali, solo le ipotesi di Dronelife). In quale anno è stata fondata la DJI? Nel 2006, DJI ha atteso quasi sette anni affinché il suo prodotto decollasse. 2. I costi aumentano notevolmente a causa del tentativo di bloccare punti tecnici chiave. Come accennato in precedenza, la nuova generazione di imprenditori solitamente non desidera trasformarsi in una semplice azienda di assemblaggio e vendita. Per questo motivo, nella fase iniziale approfondiremo alcuni punti tecnici chiave. Ciò è vantaggioso per lo sviluppo dell'azienda una volta che il prodotto inizia ad aumentare di volume. Senza il controllo su questi punti, anche se l'azienda avesse successo, oggi potrebbe trasformarsi in una specie di azienda di PC o di telefonia mobile. Potrebbe non essere sbagliato. Dopotutto, Amazon ha acquisito anche tre aziende per costruire il proprio sistema tecnologico per realizzare Echo. Ma questo senza dubbio aumenterà notevolmente i costi e i rischi per le startup e porterà l'azienda a trovarsi in una situazione di zero entrate ma con spese relativamente elevate per un lungo periodo. Da duro a morbido Che si tratti di "duro" o "morbido" o "morbido" o "duro", significa che l'azienda stessa non produce prodotti, ma fornisce servizi alle aziende che producono prodotti. Da hard a soft significa che l'azienda ritiene che i suoi vantaggi debbano iniziare dal front-end (ad esempio, l'array di microfoni) ed estendersi al back-end (il cloud). Da soft a hard, significa che l'azienda ritiene che il cloud sia il fulcro dell'intelligenza e che il front-end abbia una priorità inferiore. Naturalmente, possiamo dire che è meglio essere forti su entrambi i fronti, ma a causa delle risorse limitate e del background dei fondatori, le startup possono solitamente concentrarsi solo su una parte all'inizio. Queste due modalità possono essere rispettivamente suddivise in interazione vocale e visione artificiale. Tuttavia, è difficile spiegarli chiaramente insieme, quindi prenderemo l'interazione vocale come esempio per spiegare prima queste due modalità e poi le analizzeremo in generale. Sono relativamente poche le startup nazionali di intelligenza artificiale basate sull'interazione vocale che hanno intrapreso il percorso dall'approccio hard a quello soft. La più tipica dovrebbe essere SoundAI Technology (questa azienda è una delle mie società in portafoglio, quindi la conosco abbastanza bene). La tecnologia SoundAI parte dalla matrice acustica più elementare, eseguendo prima la soppressione del rumore, l'eliminazione del riverbero, la cancellazione dell'eco, ecc., e poi considera l'ASR, ecc., che è l'opposto del percorso intrapreso da Unisound e altri. Il vantaggio di questo modello è che può essere posizionato all'avanguardia nella filiera industriale, è facile da implementare ed è l'unico modo per ottenere dati. I dati stessi sono la forza trainante fondamentale dell'ASR e persino dell'NLU del futuro, quindi hanno un grande potenziale. Lo svantaggio è che nel breve termine, per acquisire clienti è necessario l'hardware e la produzione di hardware deve essere organizzata, il che richiede molto capitale iniziale. Si può affermare che in realtà ci sono due requisiti esterni per il successo di una startup basata su un prodotto: uno è che debba emergere una tendenza, e l'altro è che il prodotto debba superare la prova del mercato. Le aziende che passano da soluzioni hard a soluzioni soft hanno anche due requisiti esterni: uno è che la tendenza debba arrivare, e l'altro è che debbano avere forti vantaggi in termini di tecnologia e prezzo. I clienti a cui si rivolgono le aziende 2B sono solitamente molto razionali e molti metodi di marketing sofisticati non risultano molto efficaci. Da morbido a duro Yunzhisheng è una tipica startup che è passata da un approccio soft a uno hard nell'interazione vocale. Questa scelta di modello e il posizionamento dell'azienda sono evidenti anche dal nome. Il vantaggio del passaggio dal soft al hard è che è più facile coprire le piattaforme informatiche mature esistenti. Ad esempio, tutte le app necessitano della propria Siri, quindi aziende come Unisound devono solo erigere barriere tecniche e aspettare che Ctrip e Toutiao si facciano avanti. La sfida principale in questa direzione è quella di competere direttamente con le grandi aziende (come Baidu e iFlytek). In questo articolo ci concentreremo principalmente sull'implementazione di nuovi prodotti hardware, pertanto non approfondiremo questo punto. Lo svantaggio è che è difficile da implementare su nuovi prodotti hardware (Echo, automobili, robot, AR, ecc.), perché per implementarlo su nuovi prodotti hardware, lo strato array deve essere aggiunto al centro, altrimenti l'effetto sarà molto scarso. Se non potrà essere implementato, i suoi vantaggi tecnologici saranno facilmente vanificati. L'accuratezza del riconoscimento vocale è essenzialmente basata sui dati, ma ovviamente non è possibile implementarla senza hardware come gli array. Senza implementazione non ci sono dati ed è difficile ottenere feedback positivi e negativi su dati, tecnologia, accuratezza e scenari. Inoltre, non è facile risolvere il problema dell'accuratezza del riconoscimento vocale in ambienti reali. Yunzhisheng e altri se ne sono ovviamente resi conto e stanno attivamente lavorando in questa direzione. In questo periodo, le aziende produttrici di software incontrano solitamente problemi generali quando passano alla produzione di hardware, come l'impossibilità di contrattare con la catena di fornitura, il che fa sì che il costo dello stesso prodotto aumenti di diverse decine di punti percentuali. La differenza nei percorsi nasce dalla comprensione dell'architettura informatica Nell'esempio sopra riportato viene utilizzata un'azienda di semantica vocale, ma in realtà lo stesso vale per la visione artificiale, solo che i dettagli potrebbero essere diversi. Ad esempio, il chip di Movidus potrebbe completare il processo di riconoscimento delle immagini sul terminale, senza la necessità di elaborarle autonomamente come un array di microfoni e poi trasmettere i risultati al cloud. Ciò che accomuna questa scelta di modelli è la comprensione e i presupposti dell'architettura informatica. Finora, ci sono tre tipi di tali ipotesi e cognizioni: Uno è garantire l'esperienza (velocità, ecc.) e la fine gioca sempre un ruolo importante, e il cloud viene utilizzato per assistere la fine nel completamento dei calcoli. Tutti i prodotti hardware che utilizziamo: telefoni cellulari, tablet, ecc. seguono fondamentalmente questo modello. Una è che l'elaborazione dati dovrebbe avvenire principalmente nel cloud. Il ChromeBook promosso da Google è di questo modello e anche i terminali presenti nelle banche erano di questo modello. Uno è l'emergente sensore + fog computing + architettura cloud. Questa può essere vista come un'estensione della prima architettura. Ad esempio, se tutti i dispositivi di una casa intelligente sono collegati direttamente al cloud, i costi di elaborazione sono troppo elevati. Sarebbe meglio avere un hub a casa per elaborare ciò che può essere elaborato per primo (ad esempio, accendere l'aria condizionata quando fa freddo e chiudere le finestre quando piove, senza trasmetterlo al cloud). Se ciò non fosse possibile, connettersi al cloud. Le prime due architetture spesso causano PK nella realtà e portano a gravi conseguenze. Ecco due esempi: Un PK ha avuto luogo su un PC. A quel tempo, il Network Computer che Oracle e altri stavano cercando di realizzare consisteva essenzialmente nel trasferire tutti i tipi di calcoli al back-end, trasformando il front-end in un dispositivo di input e output. Questo tentativo ovviamente fallì miseramente, ma la cosa interessante è che più di 20 anni dopo, quando la categoria dei PC era sufficientemente matura, i Chromebook, che seguivano ancora questa strada, videro qualche speranza di successo. Uno è accaduto alle APP native e a HTML5. A quel tempo, Facebook voleva davvero promuovere HTML5. Zuckerberg voleva usare la Web App per rompere il monopolio di iOS e Android, ma in realtà Facebook è quasi morta a causa di questa scelta, perché questa scelta ha quasi fatto sì che sentisse la mancanza di Internet mobile. Le successive acquisizioni su larga scala di Instagram e WhatsApp sono state probabilmente collegate a questa scelta sbagliata. La mia personale comprensione di base è questa: quando appare per la prima volta una nuova categoria di prodotto hardware, prima di tutto, il terminale deve essere sufficientemente potente da offrire l'esperienza definitiva. Con lo sviluppo graduale delle applicazioni, della larghezza di banda, ecc., la potenza di calcolo potrebbe essere trasferita al cloud perché ci sarebbero vantaggi in termini di costi, ma ciò richiederebbe un lungo processo. Ci sono voluti più di 20 anni prima che il PC si rendesse conto di questa possibilità. Se ciò è corretto, significa che per i nuovi prodotti hardware il primo modello ad essere stabilito sarà da hard a soft, anziché da soft a hard. La realtà aumentata, la guida autonoma, ecc., come l'interazione vocale menzionata sopra, devono prima risolvere i problemi sul terminale in modo che il prodotto possa rispondere in modo rapido e preciso in tempo reale e garantire l'esperienza dell'utente prima di discutere di altro. Possiamo considerare la questione anche da un'altra angolazione. Per i nuovi prodotti, è più probabile che esca prima l'iPhone e poi il telefono Android, piuttosto che il contrario, perché l'iPhone ha un impatto maggiore sugli utenti ed è più probabile che stabilisca una nuova categoria, ma l'iPhone non può essere creato utilizzando HTML. Ma il modello da hard a soft pone requisiti più complessi per i fondatori. Ad esempio, Chen Xiaoliang di SoundAI Technology è prima di tutto un esperto di acustica e anche di riconoscimento vocale, quindi ha scelto di partire dal front-end e di combinarlo con il back-end. Il CTO di Yunzhisheng è un informatico più abile negli algoritmi e nell'apprendimento profondo, quindi è intrinsecamente portato a utilizzare dati, algoritmi di reti neurali e una potenza di calcolo notevolmente aumentata (dal cloud computing all'HPC) per risolvere i problemi. Per passare a un obiettivo più mirato è necessario superare barriere sia mentali che tecniche, il che potrebbe non essere facile. riepilogo Le due cose seguenti sono altamente certe : 1. L'ondata dell'intelligenza artificiale sta arrivando. 2. Ci saranno sicuramente nuovi prodotti hardware. Pertanto, da questa linea di prodotti emergeranno sicuramente nuovi unicorni. Se credi che i nuovi prodotti hardware debbano essere supportati da terminali potenti per garantire una buona esperienza e che l'ordine di base di comparsa delle nuove categorie sia che prima arrivi l'iPhone e poi Android, allora probabilmente concorderai sul fatto che gli unicorni appariranno prima nel modello dall'hardware al software. (Ho parlato di queste opinioni con molte persone, ma per coincidenza, ho incontrato solo di recente una bellissima donna investitrice che condivideva le mie stesse opinioni. Non diresti che ho plagiato le sue opinioni...) È necessario sottolineare che questo articolo esamina principalmente i possibili stati dei nuovi prodotti hardware. L'analisi dei dati non è trattata in questo articolo (l'analisi dei dati è puro cloud computing) e non riguarda nemmeno i prodotti o servizi destinati principalmente a piattaforme esistenti (telefoni cellulari, tablet, ecc.). Vincitore del Qingyun Plan di Toutiao e del Bai+ Plan di Baijiahao, del Baidu Digital Author of the Year 2019, del Baijiahao's Most Popular Author in the Technology Field, del Sogou Technology and Culture Author 2019 e del Baijiahao Quarterly Influential Creator 2021, ha vinto numerosi premi, tra cui il Sohu Best Industry Media Person 2013, il China New Media Entrepreneurship Competition Beijing 2015, il Guangmang Experience Award 2015, il China New Media Entrepreneurship Competition Finals 2015 e il Baidu Dynamic Annual Powerful Celebrity 2018. |
<<: Il governo del Michigan usa la compensazione VW per promuovere lo sviluppo ZEV
>>: Quanto ne sai sui benefici del caffè per la salute?
A Letter of Love - La lettera d'amore più bre...
Con l'abbassarsi delle temperature, anche il ...
I cinque chili persi in estate non sono ancora pe...
Promuove efficacemente il metabolismo, metodo di ...
Che cosa sono i prodotti Royal Canin Pet Foods? Ro...
[Suggerimento fondamentale]: Che tipo di esercizi...
A casa non possiamo fare a meno dei taglieri per ...
Film "Go Go! L'appello e la valutazione ...
Di recente, l'Associazione di Pechino per la ...
Cos'è il muscolo nascosto? In parole povere, ...
"Proteggiti dalle ombre!" ": Il fa...
Qual è il sito web di Richard Miller? Richard Mill...
"Kids on the Slope": una storia commove...
Prima e dopo l'inizio della scuola, molti ado...
Questa è la prova del body shaping post-partum di...