Basandosi sul grande modello dell'intelligenza artificiale, costruisci delicate interazioni emotive che possono essere percepite dai consumatori
Attraverso sensori tattili, microfoni, telecamere e sensori di rilevamento a infrarossi che coprono la testa e viceversa, può percepire l'ambiente circostante e interagire con l'ambiente circostante.
Fusione di input vocale e input visivo (concentrandosi su fotogrammi statici), utilizzando una "multimodale testo-immagine
modello grande" per produrre conversazioni
Esistono 7 metodi di rilevamento per innescare l'espressione emotiva del simpatico animale domestico, rendendo facile averne uno
senso della vita
Supporta il riconoscimento vocale in campo lontano (raggio di 5 metri) e il rilevamento del suono direzionale per la ricezione comandi vocali.
Desktop, display sul comodino, abbraccio
Posizione relativamente fissa, esigenze di mobilità deboli, connessione a lungo termine al caricabatterie
| ASR+LLM Comprensione dell'immagine visiva Assistente alla vita Temporizzatore a infrarossi Memoria del dialogo Impostazioni dei caratteri |
| Piattaforma di modelli su larga scala basata su cloud collegata in rete (Percezione multimodale, modello linguistico ampio, memoria conversazionale, query di rete) |
| Strato del sistema di percezione e controllo multimodale | |||
| Comprensione della scenaControllo del trigger | Controllo dell'illuminazione | Traduzione di conversazioni | Controllo dello schermo |
| Strato di incorporamento dell'hardware (corpo del robot) | ||||
Scena
comprensioneControllo del trigger |
Illuminazione
Controllo |
Controllo motorio |
Visualizzazione
Controllo |
Visualizzazione
Controllo |
| Dispositivo | Specifiche/caratteristiche |
| Microfono | Supporta il riconoscimento vocale in campo lontano (raggio di 5 metri) e il rilevamento del suono direzionale per la ricezione comandi vocali. |
| Telecamera | Utilizzato per il riconoscimento dell'ambiente e degli oggetti. |
| Sensore a infrarossi | Utilizzato per il risveglio a bassa potenza attivato dal corpo umano/animale domestico. |
| Sensore tattile | I moduli tattili distribuiti (testa, schiena, addome) vengono utilizzati per rilevare carezze e carezze (ad es "toccare la testa" e "solleticare"). |
| Sensore di gravità | Percepisce lo stato di movimento del corpo e attiva un "segnale di pericolo" (come un messaggio vocale "Sono caduto e fa male") quando il prodotto cade. |
| Dispositivo | Specifiche/caratteristiche |
| Schermo di espressione LCD | Schermo LCD da 4,28 pollici (occhi), supporta la visualizzazione delle espressioni dinamiche e la visualizzazione binoculare (come feedback visivo quando "si finge morto" o "si comporta in modo carino"). |
| Altoparlante | Altoparlante full-range mono/4Ω, 5W (come l'emissione vocale quando "canta una canzone" o "racconta una barzelletta"). |
| Strisce luminose a LED a colori | Strisce luminose colorate che riproducono rilevanti effetti luminosi di "stato emotivo" o possono essere utilizzate come spie luminose. |
| Dispositivo | Specifiche/caratteristiche |
| Motore passo-passo | Doppi motori per agitare e girare la testa (vita) |
| Dispositivo | Specifiche/caratteristiche |
| Chip di controllo principale | V821: controllo delle funzioni di base, elaborazione vocale, display asincrono binoculare |
| Wi-Fi/Bluetooth | Wi-Fi 2.4G + Bluetooth |
| Unità di stoccaggio | NAND FLASH 256 MB, 64 MB DRAM |
| Dispositivo | Specifiche/caratteristiche |
| Batteria al litio | Capacità di 3000 mAh/7,2 V, supporta la ricarica rapida, 2 ore di durata della batteria e 2 giorni di autonomia. standby completo; dotato di un chip di rilevamento della potenza. |
| Carica | USB di tipo C |
| Moduli accessori | È possibile modificare diversi stili di abbigliamento e accessori |
| arrabbiato | alza gli occhi al cielo | fiacco | comportati bene |
| entusiasmo | triste | imbarazzante | Timido |
| ridendo forte | sorriso | occhi del cuore | stand-by |
| sonno | Carino | offeso | Sun Wukong |
| stordimento | curioso | strabico | cattivo |