Garantire la a sicurezza dei dati è parte integrante di tutti i processi interni ad un’azienda. Le imprese cercano pertanto di proteggere i loro dati e quelli dei loro clienti e di soddisfare gli standard più evoluti di sicurezza e di conformità. Anche l’analisi predittiva deve operare all’interno di queste iniziative.

La piattaforma RapidMiner è conforme agli standard di sicurezza in quanto permette Autenticazione, Autorizzazione, Affidabilità e Crittografia dei dati.

La sfida

Lo scambio dei dati aziendali è un flusso in continuo movimento che avviene attraverso diverse forme:

  • file (ad esempio CSV, XLSX, ecc.)
  • email tra i membri dei team
  • dump di dati SQL che gli amministratori del database forniscono ai data scientist
  • dati transazionali dei clienti nei cluster Hadoop.

Questi dati rappresentano da un lato un vantaggio competitivo per un’impresa, e allo stesso tempo possono costituire una debolezza. Mentre le aziende si dedicano allo studio dei dati in loro possesso per elaborare strategie, dipendenti malintenzionati ed elementi criminali esterni concentrano i loro sforzi sul furto e sull’uso improprio di tali informazioni.

Eventuali violazioni dei sistemi:

  • mettono a rischio i dati dei clienti
  • richiedono costi ingenti per essere risolti
  • danneggiano la reputazione dell’azienda.

Una parte della sicurezza è guidata da una politica informatica solida e basata su hardware (ad es. disabilitare le porte USB o non consentire gli allegati di posta elettronica). Altri aspetti devono essere gestiti a livello di dati e applicazioni.

Modello per l’implementazione della sicurezza dei dati

modello sicurezza dati

Il modello di sicurezza standard

È un sistema a 4 livelli:

  • Sicurezza perimetrale

Riguarda l’autenticazione di un utente, cioè garantire che sia colui che dichiara di essere. In un’azienda tipica, gli utenti si connettono ai computer portatili o alle workstation tramite un metodo SSO (Single Sign-on), e spesso il computer dell’utente è protetto da proxy o firewall.

  • Sicurezza dell’accesso ai dati

Riguarda l’autorizzazione all’accesso ai dati, cioè consentire l’accesso degli utenti solo ai dati, ai servizi e alle risorse a cui hanno diritto. Gli amministratori IT possono concedere permessi di lettura o di scrittura. Negli ambienti di produzione, possono assegnare ruoli speciali da utilizzare per eseguire o pianificare i lavori. I dati e i processi chiave possono essere limitati e bloccati utilizzando la sicurezza dell’accesso basata su permessi e ruoli.

  • Responsabilità

Consente agli amministratori di monitorare e verificare l’accesso ai dati se risiedono in database, server o cluster Hadoop. Ulteriori misure includono il data lineage, che permette di capire da dove provengono i dati e come diversi set di dati si basano l’uno sull’altro.

  • Protezione dei dati

È costituito da un ampio campo, che comprende la crittografia dei dati al riavvio, la crittografia on-the-wire, il mascheramento dei dati e molto altro ancora.

Sicurezza nella piattaforma RapidMiner

RapidMiner è all’avanguardia nella scienza dei dati: offre facilità d’uso e analisi visiva.

Per esigenze di sicurezza perimetrale

Può funzionare in presenza di firewall o proxy aziendali. Tutti i prodotti possono essere installati da un amministratore IT che controlla quali versioni ed estensioni possono essere utilizzate dagli utenti finali.

RapidMiner Server e RapidMiner Radoop integrano LDAP o Active Directory per ottenere informazioni utente. Con Hadoop, questo è solitamente risolto con Kerberos, uno standard noto per l’implementazione dell’autenticazione. RapidMiner Radoop supporta Kerberos e si integra con i principali fornitori Hadoop.

Flusso di sicurezza di RapidMiner

Flusso sicurezza rapidminer

Per la sicurezza dell’accesso ai dati

RapidMiner Server può bloccare i dati e i processi di produzione tramite autorizzazioni file (ad es. Leggere, Scrivere, Eseguire). A volte gli utenti sono alla ricerca di capacità di autorizzazione più raffinate (ad es. livello colonna o livello cella). RapidMiner Radoop si integra con Apache Sentry e Apache Ranger per garantire la sicurezza dell’accesso ai dati all’ interno del cluster Hadoop.

Per Accountability

RapidMiner fornisce funzionalità di logging e versioning a supporto dell’auditing di processi e modelli.  I log vengono generati sull’intera suite di prodotti. Gli utenti autorizzati possono generare nuovi punti di versioning in cui qualsiasi lavoro in produzione, o meno, può essere riportato a un punto precedente su RapidMiner Server, se necessario. RapidMiner Radoop, supporta Cloudera Navigator e Apache Ranger.

Per la crittografia dei dati

I dati e i metadati possono essere resi anonimi tra gli endpoint interni utilizzando Obfuscation e De-obfuscation in RapidMiner Studio e RapidMiner Server. Inoltre, RapidMiner Server supporta HTTPS e HTTP con SSL che possono essere configurati come parte dell’ installazione. RapidMiner Radoop supporta la crittografia Hadoop HDFS e la crittografia via cavo.

Autenticazione Kerberos

Autenticazione Kerberos

Conclusione

La conformità agli standard di sicurezza è obbligatoria anche per il software aziendale.

Ogni giorno un’azienda moderna deve gestire un volume di dati sempre crescente. Questi sono un vantaggio competitivo non sempre sfruttato adeguatamente, ma rappresentano anche una grande debolezza sotto l’aspetto della sicurezza.

I data scientist usano sistematicamente fonti di dati disparate per elaborare strategie per garantire alla compagnia vantaggi competitivi, ma usano molti software diversi per farlo.

La piattaforma RapidMiner è progettata per soddisfare tutti gli aspetti del modello standard di implementazione della sicurezza e si integra facilmente nell’infrastruttura IT di un’impresa.  Sia nello sviluppo che nella produzione, i componenti della piattaforma RapidMiner lavorano facilmente insieme per garantire la sicurezza dall’inizio alla fine dei processi.