Al summit sulla tecnologia big data dell'era WOT "Internet +", Liu Lichun, ingegnere senior di data mining di Tencent, ha tenuto un discorso intitolato "Esplorazione dell'applicazione dei dati sociali nel campo dei report creditizi". Il contenuto principale era composto da cinque parti: informazioni di base sui report di credito sociale, dati del social network Tencent, ricerca sui profili individuali degli utenti, ricerca sulla cerchia della comunità, costruzione del modello e applicazione. Presentiamo ciascuna parte una per una. Contesto del credito sociale Liu Lichun ha affermato che il reporting creditizio non è un semplice modello di punteggio creditizio, ma è composto da tre parti: società di dati, società di reporting creditizio e utenti del credito. Le aziende di dati raccolgono o effettuano un'analisi preliminare dei dati. Tali aziende possono disporre di fonti di dati speciali, come tribunali, pubblica sicurezza, ecc. Per ottenere questi dati è necessario avere una conoscenza approfondita del settore. Le società di informazione creditizia hanno un legame con i diritti di proprietà. Inoltre, acquisteranno alcuni dati da società di dati terze per arricchire le dimensioni dei loro dati, svolgeranno alcune attività di reporting creditizio sulla base di tali dati e forniranno alcune soluzioni a livello di reporting creditizio. L'utente del servizio di segnalazione creditizia è la persona a cui viene in ultima analisi fornita la soluzione di segnalazione creditizia. In generale, intendiamo le banche e gli istituti di prestito P2P. Queste tre parti, messe insieme, formano la filiera industriale complessiva del settore dell'informazione creditizia. Agenzie di informazione creditizia tradizionali Famosa società americana di segnalazione creditizia Cronologia dello sviluppo del reporting creditizio nazionale Sulla base dei dati nelle quattro figure sopra, se i dati sociali possono essere utilizzati nei report di credito , possono essere un buon supplemento al sistema di report di credito della banca centrale? Liu Lichun ha affermato che questa è stata la prima domanda a cui ha pensato Tencent mentre lavorava al progetto di rendicontazione del credito sociale. I dati sociali sono enormi, ma non tutti sono dati validi. Dipende anche se lo scenario aziendale dell'applicazione specifica è rilevante per i dati e se i dati possono essere realmente utilizzati nel modello o nell'algoritmo finale. Ciò solleva una serie di domande: i dati sociali sono correlati alle valutazioni creditizie? I dati sulle transazioni hanno naturalmente attributi finanziari, ma li hanno anche i dati sociali? I dati sociali sono altamente destrutturati: come possiamo quindi estrarli e utilizzarli in modo efficace? Prima di parlare della composizione dei dati del social network di Tencent, Liu Lichun ha introdotto le dimensioni analitiche del reporting creditizio tradizionale. La prima riguarda le informazioni di base dell'utente, come età, sesso, occupazione, reddito, stato civile, anni di lavoro, condizione lavorativa, ecc., che sono sostanzialmente gli stessi dati ottenuti da ogni banca o da ogni agenzia di informazioni creditizie. Il secondo è la situazione creditizia, che include il numero di carte di credito richieste dall'utente e il numero di volte in cui è stato consultato il rapporto creditizio nel mese precedente. Come tutti sappiamo, il numero di volte in cui è stato consultato il rapporto di credito può indicare direttamente se l'utente ha richiesto prestiti o carte di credito con frequenza di recente. Se il numero di tali transazioni è particolarmente elevato di recente, significa che la persona è stata recentemente a corto di denaro, il che può influire sulla sua situazione creditizia e incidere direttamente sul limite di credito. Analisi SWOT del credito sociale Tencent L'immagine sopra è un'analisi SWOT di Tencent Social Credit, in cui sono chiaramente visibili i suoi punti di forza, di debolezza, le opportunità e i rischi. Con un'analisi così dettagliata, è inevitabile un'indagine sulla situazione creditizia personale, ma prima di farlo, dobbiamo sapere chiaramente come si presenta l'oggetto dell'indagine creditizia, quindi abbiamo iniziato a condurre ricerche sui ritratti dei singoli utenti. Ricerca sul ritratto dell'utente individuale Liu Lichun ha affermato che le sfide incontrate nella conduzione di ricerche sui ritratti degli utenti individuali includono principalmente i seguenti tre aspetti: in primo luogo, come sfruttare appieno le varie risorse di dati approfonditi di Tencent e le connessioni tra loro? In secondo luogo, come adattare i ritratti degli utenti ai diversi scenari applicativi? Terzo, come elaborare in modo efficiente enormi quantità di dati degli utenti (oltre 1 miliardo di utenti QQ e più di 100 miliardi di dati di registro di vario tipo)? Di fronte a queste sfide, Liu Lichun ha fornito le seguenti soluzioni corrispondenti: 1. Progettare algoritmi di data mining specifici per diversi tipi di dati sottostanti per analizzare le caratteristiche comportamentali degli utenti e formare etichette sottostanti. Considerare in modo completo diverse fonti di dati per formare un'etichetta utente astratta di livello superiore 2. Stabilire un'architettura completa del sistema di etichette per i ritratti degli utenti, per descriverli secondo diverse dimensioni e granularità. 3. Creare un sistema di data mining dei ritratti degli utenti basato su una piattaforma di elaborazione di apprendimento automatico e di archiviazione su larga scala, calcolare ed estrarre regolarmente tutti i dati degli utenti e fornire servizi di query e utilizzo dei tag degli utenti. Architettura del sistema di ritratti dell'utente Sistema di data mining del testo del ritratto dell'utente Ritratto dell'utente Industria mineraria Risultati dell'estrazione dei ritratti degli utenti Il risultato della ricerca sul ritratto personale dell'utente è quello di formare un ritratto relativamente completo dopo aver estratto dati strutturati, classificazione del testo, dati LBS e comunicazione e diffusione sui social network, come alcuni attributi di base della popolazione come età, città natale, interessi, ecc. Allo stesso tempo, verrà espresso un giudizio sullo stato civile dell'utente. Grazie a questi dati, possiamo svolgere numerose indagini sul credito sociale basandoci sui dati degli utenti. Ricerca del circolo comunitario Il circolo comunitario qui menzionato è in realtà il circolo QQ. Liu Lichun ha affermato che nel 2012 è stato raggiunto un risultato molto importante nel social network: l'applicazione dei risultati estratti all'intero front-end degli utenti QQ. Un esempio specifico è che se hai un collega di un utente, non sarete direttamente amici, ma Tencent conoscerà la potenziale relazione durante questo periodo, oppure vi raggrupperà automaticamente tra colleghi e aggiungerà note. Questo risultato suscitò molte polemiche all'epoca. Alcune persone ritenevano che ciò facilitasse la ricerca di potenziali amici, mentre altri ritenevano che violasse la loro privacy. Oltre al loro utilizzo personale, i cerchi QQ vengono impiegati anche in molti altri scenari. Ad esempio, viene utilizzato per estrarre informazioni sui titoli di studio basandosi sulle note degli amici nei circoli QQ. Ad esempio, se molte persone indicano questo utente come compagno di corso universitario, il sistema potrebbe stabilire che il mio titolo di studio è una laurea triennale. Tencent ha verificato questi dati utilizzando alcuni dati reali. Il tasso di copertura dei dati è di circa il 74% e il tasso di accuratezza è superiore al 90%. Applicazioni della topologia dei social network Esistono due applicazioni principali della topologia dei social network: una è la determinazione del tipo di topologia, l'altra è lo studio dell'influenza di questi tipi in questa catena di relazioni. I tipi topologici più iconici sono le strutture triangolari e a forma di cuore. Costruzione e applicazione del modello Come possiamo quindi integrare nel modello la ricerca sui ritratti dei singoli utenti e sulle cerchie della comunità? Liu Lichun ha affermato che la prima cosa da fare è stabilire un modello sociale, ma prima di procedere alla modellazione è necessario fare alcune ipotesi di base. Ad esempio, se due numeri QQ appartengono alla stessa persona, ci sono alcune caratteristiche evidenti. La prima è che spesso effettuerà l'accesso dallo stesso dispositivo, o effettuerà l'accesso dallo stesso IP, o potrebbe avere altre caratteristiche e così via. Infine, queste caratteristiche vengono utilizzate per costruire un modello che consenta di determinare se le persone dietro determinati numeri QQ sono la stessa persona. Il tasso di accuratezza è di circa l'85% e il tasso di copertura di circa il 75%. Derivazione delle variabili e risultati del modello Effetto complessivo del modello Applicazione Weilidai Infine, Liu Lichun ha introdotto il processo specifico di richiesta del modello di segnalazione creditizia in WeChat Loan. L'immagine sopra è uno screenshot del prodotto. Se quando apri QQ vedi l'ingresso di WeChat Loan, significa che è nella whitelist esaminata da Tencent. Non appena clicchi sull'attivazione dell'applicazione, verrà immediatamente calcolato per te un limite di credito. Anche se vuoi prendere in prestito denaro, la procedura è molto veloce. Una volta vincolata la tua carta di credito, il prestito dovrebbe essere trasferito sul tuo conto entro due minuti. Infatti, rispetto all'indebitamento presso le banche tradizionali, questa efficienza fa un salto di qualità. Ma più semplice appare il prodotto front-end, più complessa può essere la tecnologia che lo supporta. Il modello di segnalazione creditizia, ovvero la tecnologia alla base di WeChat Loan, è progettato per selezionare gli utenti con un buon merito creditizio e fornire loro servizi di prestito. autore: |
<<: Nielsen: sondaggio mostra che gli americani usano le app per più di un'ora al giorno
>>: “Assistenza sanitaria al radon” è “assistenza sanitaria” o “giocare con la vita”?
Cos'è ZOO YORK? ZOO YORK è un famoso marchio a...
Bere succhi di frutta è un'abitudine molto co...
Fonte: Dipartimento di medicina intensiva, Ospeda...
Dopo il capodanno cinese si è verificato un gran ...
Qual è il sito web del Vitesse Football Club? Stic...
Qual è il sito web dell'Ambasciata cinese in B...
Le cozze sono molluschi dal carattere caldo. Sia ...
Che cos'è BDO International? BDO International...
Qual è il sito web del Girona Football Club? Il Gi...
La meditazione può non solo preservare la salute ...
Il 1° febbraio, Tesla ha rilasciato ufficialmente...
I problemi di secchezza oculare emergono gradualm...
Il 10 gennaio 2018 è stato il compleanno di Liu G...
Questo è il 3539° articolo di Da Yi Xiao Hu Molte...
Il linfoma è un tumore maligno che ha origine dal...