Esplorazione dell'applicazione dei dati sociali nel campo dell'informazione creditizia

Esplorazione dell'applicazione dei dati sociali nel campo dell'informazione creditizia

Al summit sulla tecnologia big data dell'era WOT "Internet +", Liu Lichun, ingegnere senior di data mining di Tencent, ha tenuto un discorso intitolato "Esplorazione dell'applicazione dei dati sociali nel campo dei report creditizi". Il contenuto principale era composto da cinque parti: informazioni di base sui report di credito sociale, dati del social network Tencent, ricerca sui profili individuali degli utenti, ricerca sulla cerchia della comunità, costruzione del modello e applicazione. Presentiamo ciascuna parte una per una.

Contesto del credito sociale

Liu Lichun ha affermato che il reporting creditizio non è un semplice modello di punteggio creditizio, ma è composto da tre parti: società di dati, società di reporting creditizio e utenti del credito. Le aziende di dati raccolgono o effettuano un'analisi preliminare dei dati. Tali aziende possono disporre di fonti di dati speciali, come tribunali, pubblica sicurezza, ecc. Per ottenere questi dati è necessario avere una conoscenza approfondita del settore. Le società di informazione creditizia hanno un legame con i diritti di proprietà. Inoltre, acquisteranno alcuni dati da società di dati terze per arricchire le dimensioni dei loro dati, svolgeranno alcune attività di reporting creditizio sulla base di tali dati e forniranno alcune soluzioni a livello di reporting creditizio. L'utente del servizio di segnalazione creditizia è la persona a cui viene in ultima analisi fornita la soluzione di segnalazione creditizia. In generale, intendiamo le banche e gli istituti di prestito P2P. Queste tre parti, messe insieme, formano la filiera industriale complessiva del settore dell'informazione creditizia.

Agenzie di informazione creditizia tradizionali

Famosa società americana di segnalazione creditizia

Cronologia dello sviluppo del reporting creditizio nazionale

Sulla base dei dati nelle quattro figure sopra, se i dati sociali possono essere utilizzati nei report di credito , possono essere un buon supplemento al sistema di report di credito della banca centrale? Liu Lichun ha affermato che questa è stata la prima domanda a cui ha pensato Tencent mentre lavorava al progetto di rendicontazione del credito sociale. I dati sociali sono enormi, ma non tutti sono dati validi. Dipende anche se lo scenario aziendale dell'applicazione specifica è rilevante per i dati e se i dati possono essere realmente utilizzati nel modello o nell'algoritmo finale. Ciò solleva una serie di domande: i dati sociali sono correlati alle valutazioni creditizie? I dati sulle transazioni hanno naturalmente attributi finanziari, ma li hanno anche i dati sociali? I dati sociali sono altamente destrutturati: come possiamo quindi estrarli e utilizzarli in modo efficace?

Dati del social network Tencent

Prima di parlare della composizione dei dati del social network di Tencent, Liu Lichun ha introdotto le dimensioni analitiche del reporting creditizio tradizionale. La prima riguarda le informazioni di base dell'utente, come età, sesso, occupazione, reddito, stato civile, anni di lavoro, condizione lavorativa, ecc., che sono sostanzialmente gli stessi dati ottenuti da ogni banca o da ogni agenzia di informazioni creditizie. Il secondo è la situazione creditizia, che include il numero di carte di credito richieste dall'utente e il numero di volte in cui è stato consultato il rapporto creditizio nel mese precedente. Come tutti sappiamo, il numero di volte in cui è stato consultato il rapporto di credito può indicare direttamente se l'utente ha richiesto prestiti o carte di credito con frequenza di recente. Se il numero di tali transazioni è particolarmente elevato di recente, significa che la persona è stata recentemente a corto di denaro, il che può influire sulla sua situazione creditizia e incidere direttamente sul limite di credito.

L'immagine sopra mostra lo stato attuale dei dati di Tencent, che include dati provenienti da molte dimensioni e copre un numero relativamente più completo di utenti.

Analisi SWOT del credito sociale Tencent

L'immagine sopra è un'analisi SWOT di Tencent Social Credit, in cui sono chiaramente visibili i suoi punti di forza, di debolezza, le opportunità e i rischi. Con un'analisi così dettagliata, è inevitabile un'indagine sulla situazione creditizia personale, ma prima di farlo, dobbiamo sapere chiaramente come si presenta l'oggetto dell'indagine creditizia, quindi abbiamo iniziato a condurre ricerche sui ritratti dei singoli utenti.

Ricerca sul ritratto dell'utente individuale

Liu Lichun ha affermato che le sfide incontrate nella conduzione di ricerche sui ritratti degli utenti individuali includono principalmente i seguenti tre aspetti: in primo luogo, come sfruttare appieno le varie risorse di dati approfonditi di Tencent e le connessioni tra loro? In secondo luogo, come adattare i ritratti degli utenti ai diversi scenari applicativi? Terzo, come elaborare in modo efficiente enormi quantità di dati degli utenti (oltre 1 miliardo di utenti QQ e più di 100 miliardi di dati di registro di vario tipo)? Di fronte a queste sfide, Liu Lichun ha fornito le seguenti soluzioni corrispondenti:

1. Progettare algoritmi di data mining specifici per diversi tipi di dati sottostanti per analizzare le caratteristiche comportamentali degli utenti e formare etichette sottostanti. Considerare in modo completo diverse fonti di dati per formare un'etichetta utente astratta di livello superiore

2. Stabilire un'architettura completa del sistema di etichette per i ritratti degli utenti, per descriverli secondo diverse dimensioni e granularità.

3. Creare un sistema di data mining dei ritratti degli utenti basato su una piattaforma di elaborazione di apprendimento automatico e di archiviazione su larga scala, calcolare ed estrarre regolarmente tutti i dati degli utenti e fornire servizi di query e utilizzo dei tag degli utenti.

Architettura del sistema di ritratti dell'utente

Sistema di data mining del testo del ritratto dell'utente

Ritratto dell'utente Industria mineraria

Risultati dell'estrazione dei ritratti degli utenti

Il risultato della ricerca sul ritratto personale dell'utente è quello di formare un ritratto relativamente completo dopo aver estratto dati strutturati, classificazione del testo, dati LBS e comunicazione e diffusione sui social network, come alcuni attributi di base della popolazione come età, città natale, interessi, ecc. Allo stesso tempo, verrà espresso un giudizio sullo stato civile dell'utente. Grazie a questi dati, possiamo svolgere numerose indagini sul credito sociale basandoci sui dati degli utenti.

Ricerca del circolo comunitario

Il circolo comunitario qui menzionato è in realtà il circolo QQ. Liu Lichun ha affermato che nel 2012 è stato raggiunto un risultato molto importante nel social network: l'applicazione dei risultati estratti all'intero front-end degli utenti QQ. Un esempio specifico è che se hai un collega di un utente, non sarete direttamente amici, ma Tencent conoscerà la potenziale relazione durante questo periodo, oppure vi raggrupperà automaticamente tra colleghi e aggiungerà note. Questo risultato suscitò molte polemiche all'epoca. Alcune persone ritenevano che ciò facilitasse la ricerca di potenziali amici, mentre altri ritenevano che violasse la loro privacy.

Oltre al loro utilizzo personale, i cerchi QQ vengono impiegati anche in molti altri scenari. Ad esempio, viene utilizzato per estrarre informazioni sui titoli di studio basandosi sulle note degli amici nei circoli QQ. Ad esempio, se molte persone indicano questo utente come compagno di corso universitario, il sistema potrebbe stabilire che il mio titolo di studio è una laurea triennale. Tencent ha verificato questi dati utilizzando alcuni dati reali. Il tasso di copertura dei dati è di circa il 74% e il tasso di accuratezza è superiore al 90%.

Applicazioni della topologia dei social network

Esistono due applicazioni principali della topologia dei social network: una è la determinazione del tipo di topologia, l'altra è lo studio dell'influenza di questi tipi in questa catena di relazioni. I tipi topologici più iconici sono le strutture triangolari e a forma di cuore.

Costruzione e applicazione del modello

Come possiamo quindi integrare nel modello la ricerca sui ritratti dei singoli utenti e sulle cerchie della comunità? Liu Lichun ha affermato che la prima cosa da fare è stabilire un modello sociale, ma prima di procedere alla modellazione è necessario fare alcune ipotesi di base. Ad esempio, se due numeri QQ appartengono alla stessa persona, ci sono alcune caratteristiche evidenti. La prima è che spesso effettuerà l'accesso dallo stesso dispositivo, o effettuerà l'accesso dallo stesso IP, o potrebbe avere altre caratteristiche e così via. Infine, queste caratteristiche vengono utilizzate per costruire un modello che consenta di determinare se le persone dietro determinati numeri QQ sono la stessa persona. Il tasso di accuratezza è di circa l'85% e il tasso di copertura di circa il 75%.

Derivazione delle variabili e risultati del modello

Effetto complessivo del modello

Applicazione Weilidai

Infine, Liu Lichun ha introdotto il processo specifico di richiesta del modello di segnalazione creditizia in WeChat Loan. L'immagine sopra è uno screenshot del prodotto. Se quando apri QQ vedi l'ingresso di WeChat Loan, significa che è nella whitelist esaminata da Tencent. Non appena clicchi sull'attivazione dell'applicazione, verrà immediatamente calcolato per te un limite di credito. Anche se vuoi prendere in prestito denaro, la procedura è molto veloce. Una volta vincolata la tua carta di credito, il prestito dovrebbe essere trasferito sul tuo conto entro due minuti. Infatti, rispetto all'indebitamento presso le banche tradizionali, questa efficienza fa un salto di qualità. Ma più semplice appare il prodotto front-end, più complessa può essere la tecnologia che lo supporta. Il modello di segnalazione creditizia, ovvero la tecnologia alla base di WeChat Loan, è progettato per selezionare gli utenti con un buon merito creditizio e fornire loro servizi di prestito.

autore:
Liu Lichun
è un ingegnere senior di data mining presso Tencent, responsabile del team di data mining presso il gruppo aziendale di social network, architetto del sistema di raccomandazione musicale QQ di prima generazione e creatore del sistema di gestione del ciclo di vita del cliente di Tencent. Da molti anni si dedica all'integrazione tra tecnologia di data mining e business e vanta una vasta esperienza pratica e di project management nei settori dell'analisi e del data mining di big data, del reporting creditizio su Internet, ecc. Attualmente ci concentriamo sul reporting creditizio su Internet, sui profili utente, sui sistemi di raccomandazione e sul text mining.

<<:  Nielsen: sondaggio mostra che gli americani usano le app per più di un'ora al giorno

>>:  “Assistenza sanitaria al radon” è “assistenza sanitaria” o “giocare con la vita”?

Consiglia articoli

Che ne dici dello ZOO YORK? Recensione e informazioni sul sito web di ZOO YORK

Cos'è ZOO YORK? ZOO YORK è un famoso marchio a...

Bere succhi di frutta fa davvero male?

Bere succhi di frutta è un'abitudine molto co...

Devo andare in ospedale se contraggo il COVID-19?

Fonte: Dipartimento di medicina intensiva, Ospeda...

Posso mangiare il porridge di cozze tutti i giorni? Come pulire le cozze fresche

Le cozze sono molluschi dal carattere caldo. Sia ...

Trattamento di agopuntura per l'asma

Questo è il 3539° articolo di Da Yi Xiao Hu Molte...