Wat is de gegevensmaskeringstechnologie en oplossing in netwerkpakketmakelaar?

1. Het concept van gegevensmaskering

Gegevensmaskering staat ook bekend als gegevensmaskering. Het is een technische methode om gevoelige gegevens te converteren, wijzigen of dekken, zoals mobiel telefoonnummer, bankkaartnummer en andere informatie wanneer we maskeerregels en beleid hebben gegeven. Deze techniek wordt voornamelijk gebruikt om te voorkomen dat gevoelige gegevens rechtstreeks in onbetrouwbare omgevingen worden gebruikt.

Gegevensmaskeringsprincipe: Gegevensmaskering moet de oorspronkelijke gegevenskenmerken, bedrijfsregels en gegevens relevantie handhaven om ervoor te zorgen dat de daaropvolgende ontwikkeling, testen en gegevensanalyse niet worden beïnvloed door maskeren. Zorg voor gegevensconsistentie en geldigheid voor en na maskering.

2. Classificatie van gegevensmaskering

Gegevensmaskering kan worden onderverdeeld in statische gegevensmaskering (SDM) en dynamische gegevensmaskering (DDM).

Statische gegevensmaskering (SDM): Statische gegevensmaskering vereist de oprichting van een nieuwe niet-productie-omgevingsdatabase voor isolatie van de productieomgeving. Gevoelige gegevens worden geëxtraheerd uit de productiedatabase en vervolgens opgeslagen in de niet-productie-database. Op deze manier worden de ongevoelige gegevens geïsoleerd van de productieomgeving, die voldoet aan de zakelijke behoeften en zorgt voor de beveiliging van productiegegevens.

SDM

Dynamic Data Masking (DDM): Het wordt over het algemeen gebruikt in de productieomgeving om gevoelige gegevens in realtime ongevoelig te maken. Soms zijn verschillende maskeringsniveaus vereist om dezelfde gevoelige gegevens in verschillende situaties te lezen. Verschillende rollen en machtigingen kunnen bijvoorbeeld verschillende maskeerschema's implementeren.

DDM

Gegevensrapportage en maskeringstoepassing van dataproducten

Dergelijke scenario's omvatten voornamelijk interne gegevensbewakingsproducten of billboard, externe servicegegevensproducten en rapporten op basis van gegevensanalyse, zoals bedrijfsrapporten en projectbeoordeling.

Gegevensrapportage Productmaskering

3. Oplossing voor gegevensmaskering

Gemeenschappelijke gegevensmaskeringsschema's zijn onder meer: ​​ongeldigheid, willekeurige waarde, gegevensvervanging, symmetrische codering, gemiddelde waarde, offset en afronding, enz.

Ongeldigheid: Invalidatie verwijst naar de codering, afknotting of verbergen van gevoelige gegevens. Dit schema vervangt meestal echte gegevens door speciale symbolen (zoals *). De bewerking is eenvoudig, maar gebruikers kunnen het formaat van de oorspronkelijke gegevens niet kennen, die de volgende gegevenstoepassingen kunnen beïnvloeden.

Willekeurige waarde: De willekeurige waarde verwijst naar de willekeurige vervanging van gevoelige gegevens (nummers vervangen cijfers, letters vervangen letters en tekens vervangen tekens). Deze maskeermethode zorgt voor het formaat van gevoelige gegevens tot op zekere hoogte en vergemakkelijkt de volgende gegevenstoepassing. Maskerende woordenboeken kunnen nodig zijn voor enkele zinvolle woorden, zoals namen van mensen en plaatsen.

Gegevensvervanging: Gegevensvervanging is vergelijkbaar met het maskeren van nul- en willekeurige waarden, behalve dat in plaats van speciale tekens of willekeurige waarden te gebruiken, de maskeergegevens worden vervangen door een specifieke waarde.

Symmetrische codering: Symmetrische codering is een speciale omkeerbare maskeermethode. Het codeert gevoelige gegevens via coderingssleutels en algoritmen. Het cijfertekst -formaat is consistent met de originele gegevens in logische regels.

Gemiddeld: Het gemiddelde schema wordt vaak gebruikt in statistische scenario's. Voor numerieke gegevens berekenen we eerst hun gemiddelde en verdelen we vervolgens willekeurig de ongevoelige waarden rond het gemiddelde, waardoor de som van de gegevensconstante wordt behouden.

Offset en afronding: Deze methode verandert de digitale gegevens per willekeurige verschuiving. De offset -afronding zorgt voor de geschatte authenticiteit van het bereik met behoud van de beveiliging van de gegevens, die dichter bij de echte gegevens ligt dan de vorige schema's, en heeft een grote betekenis in het scenario van Big Data -analyse.

ML-NPB-5660- 数据脱敏

Het aanbevelen model "ML-NPB-5660"Voor de gegevensmaskering

4. Veelgebruikte gegevensmaskeringstechnieken

(1). Statistische technieken

Gegevensbemonstering en gegevensaggregatie

- Gegevensbemonstering: de analyse en evaluatie van de oorspronkelijke gegevensset door een representatieve subset van de gegevensset te selecteren is een belangrijke methode om de effectiviteit van de-identificatietechnieken te verbeteren.

- Gegevensaggregatie: als een verzameling van statistische technieken (zoals sommatie, tellen, gemiddelde, maximum en minimum) toegepast op attributen in microdata, is het resultaat representatief voor alle records in de oorspronkelijke gegevensset.

(2). Cryptografie

Cryptografie is een veel voorkomende methode om de effectiviteit van desensibilisatie desensibilisatie te maken of te verbeteren. Verschillende soorten coderingsalgoritmen kunnen verschillende desensibilisatie -effecten bereiken.

- Deterministische codering: een niet-willekeurige symmetrische codering. Het verwerkt meestal ID -gegevens en kan de cijfertekst doen en herstellen naar de oorspronkelijke ID wanneer dat nodig is, maar de sleutel moet correct worden beschermd.

- Onomkeerbare codering: de hash -functie wordt gebruikt om gegevens te verwerken, die meestal worden gebruikt voor ID -gegevens. Het kan niet direct worden gedecodeerd en de kaartrelatie moet worden opgeslagen. Bovendien kan vanwege het kenmerk van de hash -functie datacollisie optreden.

- Homomorfe codering: het cijfertekst homomorf algoritme wordt gebruikt. Het kenmerk is dat het resultaat van cijfertekstbewerking hetzelfde is als dat van gewone tekstbewerking na decodering. Daarom wordt het vaak gebruikt om numerieke velden te verwerken, maar het wordt niet veel gebruikt om prestatieredenen.

(3). Systeemtechnologie

De onderdrukkingstechnologie verwijdert of beschrijft gegevensitems die niet voldoen aan privacybescherming, maar deze niet publiceren.

- Maskeren: het verwijst naar de meest voorkomende desensibilisatiemethode om de kenmerkwaarde te maskeren, zoals het tegenstandernummer, ID -kaart is gemarkeerd met een asterisk of het adres is afgekapt.

- Lokale onderdrukking: verwijst naar het proces van het verwijderen van specifieke kenmerkwaarden (kolommen), het verwijderen van niet-essentiële gegevensvelden;

- Record-onderdrukking: verwijst naar het proces van het verwijderen van specifieke records (rijen), het verwijderen van niet-essentiële gegevensrecords.

(4). Pseudoniem technologie

Pseudomanning is een de-identificatietechniek die een pseudoniem gebruikt om een ​​directe identificatie (of andere gevoelige identificatie) te vervangen. Pseudoniemtechnieken maken unieke identificatiegegevens voor elk individueel informatiedubool, in plaats van directe of gevoelige identificatiegegevens.

- Het kan onafhankelijk willekeurige waarden genereren om overeen te komen met de oorspronkelijke ID, de toewijzingstabel op te slaan en de toegang tot de toewijzingstabel strikt te regelen.

- U kunt ook codering gebruiken om pseudoniemen te produceren, maar moet de decoderingsleutel correct houden;

Deze technologie wordt veel gebruikt in het geval van een groot aantal onafhankelijke gegevensgebruikers, zoals OpenID in het open platformscenario, waar verschillende ontwikkelaars verschillende OpenID's voor dezelfde gebruiker verkrijgen.

(5). Generalisatietechnieken

Generalisatietechniek verwijst naar een de-identificatietechniek die de granulariteit van geselecteerde attributen in een gegevensset vermindert en een meer algemene en abstracte beschrijving van de gegevens biedt. Generalisatietechnologie is eenvoudig te implementeren en kan de authenticiteit van gegevens op recordniveau beschermen. Het wordt vaak gebruikt in gegevensproducten of gegevensrapporten.

- Afronding: omvat het selecteren van een afrondingsbasis voor het geselecteerde kenmerk, zoals opwaartse of neerwaartse forensische stoffen, die resultaten opleveren 100, 500, 1K en 10K

- Top- en onderste coderingstechnieken: Vervang waarden boven (of onder) De drempel met een drempel die het bovenste (of onderste) niveau vertegenwoordigt, wat een resultaat oplevert van "boven x" of "onder x"

(6). Randomisatietechnieken

Als een soort de-identificatietechniek verwijst randomisatietechnologie naar het wijzigen van de waarde van een kenmerk door randomisatie, zodat de waarde na randomisatie verschilt van de oorspronkelijke reële waarde. Dit proces vermindert het vermogen van een aanvaller om een ​​attribuutwaarde af te leiden uit andere attribuutwaarden in hetzelfde gegevensrecord, maar beïnvloedt de authenticiteit van de resulterende gegevens, wat gebruikelijk is bij productietestgegevens.


Posttijd: 27-2022