តើបច្ចេកវិទ្យារបាំងទិន្នន័យ និងដំណោះស្រាយនៅក្នុងបណ្តាញ កញ្ចប់ព័ត៌មាន ឈ្មួញកណ្តាលគឺជាអ្វី?

1. គំនិតនៃ Data Masking

ការបិទបាំងទិន្នន័យត្រូវបានគេស្គាល់ផងដែរថាជាការលាក់បាំងទិន្នន័យ។ វាគឺជាវិធីសាស្រ្តបច្ចេកទេសក្នុងការបំប្លែង កែប្រែ ឬគ្របដណ្តប់ទិន្នន័យរសើបដូចជាលេខទូរស័ព្ទ លេខកាតធនាគារ និងព័ត៌មានផ្សេងទៀត នៅពេលដែលយើងបានផ្តល់ច្បាប់ និងគោលការណ៍បិទបាំង។ បច្ចេកទេសនេះត្រូវបានប្រើជាចម្បងដើម្បីការពារទិន្នន័យរសើបពីការប្រើប្រាស់ដោយផ្ទាល់នៅក្នុងបរិស្ថានដែលមិនគួរឱ្យទុកចិត្ត។

គោលការណ៍របាំងទិន្នន័យ៖ ការបិទបាំងទិន្នន័យគួរតែរក្សាលក្ខណៈទិន្នន័យដើម ច្បាប់អាជីវកម្ម និងភាពពាក់ព័ន្ធទិន្នន័យ ដើម្បីធានាថាការអភិវឌ្ឍន៍ ការធ្វើតេស្ត និងការវិភាគទិន្នន័យជាបន្តបន្ទាប់នឹងមិនរងផលប៉ះពាល់ដោយការបិទបាំងនោះទេ។ ធានាឱ្យបាននូវភាពស៊ីសង្វាក់គ្នា និងសុពលភាពទិន្នន័យមុន និងក្រោយពេលបិទបាំង។

2. ចំណាត់ថ្នាក់របាំងទិន្នន័យ

ការបិទបាំងទិន្នន័យអាចត្រូវបានបែងចែកទៅជា របាំងទិន្នន័យឋិតិវន្ត (SDM) និងរបាំងទិន្នន័យថាមវន្ត (DDM) ។

ការបិទបាំងទិន្នន័យឋិតិវន្ត (SDM)៖ ការបិទបាំងទិន្នន័យឋិតិវន្តតម្រូវឱ្យមានការបង្កើតមូលដ្ឋានទិន្នន័យបរិស្ថានដែលមិនផលិតថ្មីសម្រាប់ភាពឯកោពីបរិយាកាសផលិតកម្ម។ ទិន្នន័យរសើបត្រូវបានស្រង់ចេញពីមូលដ្ឋានទិន្នន័យផលិតកម្ម ហើយបន្ទាប់មករក្សាទុកក្នុងមូលដ្ឋានទិន្នន័យដែលមិនផលិត។ តាមរបៀបនេះ ទិន្នន័យដែលខូចត្រូវបានញែកដាច់ពីបរិយាកាសផលិតកម្ម ដែលបំពេញតម្រូវការអាជីវកម្ម និងធានាសុវត្ថិភាពនៃទិន្នន័យផលិតកម្ម។

SDM

ការបិទបាំងទិន្នន័យថាមវន្ត (DDM)៖ វា​ត្រូវ​បាន​ប្រើ​ជាទូទៅ​ក្នុង​បរិយាកាស​ផលិត​ដើម្បី​បន្សាប​ទិន្នន័យ​រសើប​ក្នុង​ពេល​ជាក់ស្តែង។ ពេលខ្លះ កម្រិតផ្សេងគ្នានៃការបិទបាំងគឺតម្រូវឱ្យអានទិន្នន័យរសើបដូចគ្នាក្នុងស្ថានភាពផ្សេងៗគ្នា។ ជាឧទាហរណ៍ តួនាទី និងការអនុញ្ញាតផ្សេងៗគ្នាអាចអនុវត្តគ្រោងការណ៍របាំងផ្សេងៗគ្នា។

DDM

របាយការណ៍ទិន្នន័យ និងផលិតផលទិន្នន័យកម្មវិធីបិទបាំង

សេណារីយ៉ូបែបនេះភាគច្រើនរួមមានផលិតផលត្រួតពិនិត្យទិន្នន័យខាងក្នុង ឬផ្ទាំងប៉ាណូ ផលិតផលទិន្នន័យសេវាកម្មខាងក្រៅ និងរបាយការណ៍ផ្អែកលើការវិភាគទិន្នន័យ ដូចជារបាយការណ៍អាជីវកម្ម និងការត្រួតពិនិត្យគម្រោង។

របាំងផលិតផលរាយការណ៍ទិន្នន័យ

3. ដំណោះស្រាយរបាំងទិន្នន័យ

គ្រោងការណ៍បិទបាំងទិន្នន័យទូទៅរួមមានៈ ភាពមិនត្រឹមត្រូវ តម្លៃចៃដន្យ ការជំនួសទិន្នន័យ ការអ៊ិនគ្រីបស៊ីមេទ្រី តម្លៃមធ្យម អុហ្វសិត និងការបង្គត់។ល។

អសុពលភាព៖ អសុពលភាព សំដៅលើការអ៊ិនគ្រីប ការកាត់ចេញ ឬការលាក់ទិន្នន័យរសើប។ គ្រោងការណ៍នេះជាធម្មតាជំនួសទិន្នន័យពិតជាមួយនឹងនិមិត្តសញ្ញាពិសេស (ដូចជា *) ។ ប្រតិបត្តិការនេះគឺសាមញ្ញ ប៉ុន្តែអ្នកប្រើប្រាស់មិនអាចដឹងពីទម្រង់នៃទិន្នន័យដើម ដែលអាចប៉ះពាល់ដល់កម្មវិធីទិន្នន័យជាបន្តបន្ទាប់។

តម្លៃចៃដន្យ៖ តម្លៃចៃដន្យសំដៅលើការជំនួសដោយចៃដន្យនៃទិន្នន័យរសើប (លេខជំនួសខ្ទង់ អក្សរជំនួសអក្សរ និងតួអក្សរជំនួសតួអក្សរ)។ វិធីសាស្ត្របិទបាំងនេះនឹងធានាបាននូវទម្រង់ទិន្នន័យរសើបក្នុងកម្រិតជាក់លាក់មួយ និងជួយសម្រួលដល់កម្មវិធីទិន្នន័យជាបន្តបន្ទាប់។ ការបិទបាំងវចនានុក្រមប្រហែលជាត្រូវការសម្រាប់ពាក្យដែលមានអត្ថន័យមួយចំនួន ដូចជាឈ្មោះមនុស្ស និងទីកន្លែងជាដើម។

ការជំនួសទិន្នន័យ៖ ការជំនួសទិន្នន័យគឺស្រដៀងគ្នាទៅនឹងការបិទបាំងតម្លៃទទេ និងចៃដន្យ លើកលែងតែថាជំនួសឱ្យការប្រើតួអក្សរពិសេស ឬតម្លៃចៃដន្យ ទិន្នន័យរបាំងត្រូវបានជំនួសដោយតម្លៃជាក់លាក់មួយ។

ការអ៊ិនគ្រីបស៊ីមេទ្រី៖ ការ​អ៊ិនគ្រីប​ស៊ីមេទ្រី​គឺ​ជា​វិធីសាស្ត្រ​របាំង​បញ្ច្រាស​ពិសេស។ វាអ៊ិនគ្រីបទិន្នន័យរសើបតាមរយៈសោអ៊ិនគ្រីប និងក្បួនដោះស្រាយ។ ទម្រង់ ciphertext គឺស្របជាមួយនឹងទិន្នន័យដើមនៅក្នុងក្បួនឡូជីខល។

មធ្យម៖ គ្រោងការណ៍ជាមធ្យមត្រូវបានគេប្រើជាញឹកញាប់នៅក្នុងសេណារីយ៉ូស្ថិតិ។ សម្រាប់ទិន្នន័យជាលេខ យើងគណនាមធ្យមភាគរបស់វាជាមុនសិន ហើយបន្ទាប់មកចែកចាយដោយចៃដន្យនូវតម្លៃ desensitized ជុំវិញមធ្យម ដូច្នេះវារក្សាផលបូកនៃទិន្នន័យឱ្យថេរ។

អុហ្វសិត និងការបង្គត់៖ វិធីសាស្រ្តនេះផ្លាស់ប្តូរទិន្នន័យឌីជីថលដោយការផ្លាស់ប្តូរចៃដន្យ។ ការបង្គត់អុហ្វសិតធានាបាននូវភាពត្រឹមត្រូវប្រហាក់ប្រហែលនៃជួរ ខណៈពេលដែលរក្សាបាននូវសុវត្ថិភាពនៃទិន្នន័យ ដែលខិតទៅជិតទិន្នន័យពិតជាងគ្រោងការណ៍មុន និងមានសារៈសំខាន់យ៉ាងខ្លាំងនៅក្នុងសេណារីយ៉ូនៃការវិភាគទិន្នន័យធំ។

ML-NPB-5660-数据脱敏

ម៉ូដែលដែលបានណែនាំ "ML-NPB-5660"សម្រាប់ការបិទបាំងទិន្នន័យ

4. បច្ចេកទេសរបាំងទិន្នន័យដែលប្រើជាទូទៅ

(1). បច្ចេកទេសស្ថិតិ

គំរូទិន្នន័យ និងការប្រមូលផ្តុំទិន្នន័យ

- គំរូទិន្នន័យ៖ ការវិភាគ និងវាយតម្លៃនៃសំណុំទិន្នន័យដើមដោយជ្រើសរើសសំណុំរងតំណាងនៃសំណុំទិន្នន័យ គឺជាវិធីសាស្ត្រសំខាន់មួយក្នុងការបង្កើនប្រសិទ្ធភាពនៃបច្ចេកទេសកំណត់អត្តសញ្ញាណ។

- ការប្រមូលផ្តុំទិន្នន័យ៖ ជាការប្រមូលផ្ដុំនៃបច្ចេកទេសស្ថិតិ (ដូចជាការបូកសរុប ការរាប់ ជាមធ្យម អតិបរមា និងអប្បបរមា) ដែលត្រូវបានអនុវត្តចំពោះគុណលក្ខណៈនៅក្នុង microdata លទ្ធផលគឺតំណាងឱ្យកំណត់ត្រាទាំងអស់នៅក្នុងសំណុំទិន្នន័យដើម។

(២). ការសរសេរកូដសម្ងាត់

Cryptography គឺជាវិធីសាស្រ្តទូទៅមួយដើម្បី desensitize ឬបង្កើនប្រសិទ្ធភាពនៃការ desensitization ។ ប្រភេទផ្សេងគ្នានៃក្បួនដោះស្រាយការអ៊ិនគ្រីបអាចសម្រេចបាននូវឥទ្ធិពល desensitization ផ្សេងគ្នា។

- Deterministic encryption៖ ការអ៊ិនគ្រីបស៊ីមេទ្រីមិនចៃដន្យ។ ជាធម្មតាវាដំណើរការទិន្នន័យលេខសម្គាល់ ហើយអាចឌិគ្រីប និងស្ដារអក្សរសម្ងាត់ទៅលេខសម្គាល់ដើមវិញនៅពេលចាំបាច់ ប៉ុន្តែសោត្រូវការពារឱ្យបានត្រឹមត្រូវ។

- ការអ៊ិនគ្រីបដែលមិនអាចត្រឡប់វិញបាន៖ មុខងារ hash ត្រូវបានប្រើដើម្បីដំណើរការទិន្នន័យ ដែលជាធម្មតាត្រូវបានប្រើសម្រាប់ទិន្នន័យលេខសម្គាល់។ វាមិនអាចឌិគ្រីបដោយផ្ទាល់បានទេ ហើយទំនាក់ទំនងផែនទីត្រូវតែរក្សាទុក។ លើសពីនេះទៀតដោយសារតែលក្ខណៈពិសេសនៃមុខងារ hash ការប៉ះទង្គិចទិន្នន័យអាចកើតឡើង។

- ការអ៊ិនគ្រីប homomorphic៖ ក្បួនដោះស្រាយ ciphertext homomorphic ត្រូវបានប្រើ។ លក្ខណៈរបស់វាគឺថាលទ្ធផលនៃប្រតិបត្តិការ ciphertext គឺដូចគ្នានឹងប្រតិបត្តិការអត្ថបទធម្មតាបន្ទាប់ពីការឌិគ្រីប។ ដូច្នេះ វាត្រូវបានគេប្រើជាទូទៅដើម្បីដំណើរការវាលលេខ ប៉ុន្តែវាមិនត្រូវបានគេប្រើយ៉ាងទូលំទូលាយសម្រាប់ហេតុផលដំណើរការនោះទេ។

(៣). បច្ចេកវិទ្យាប្រព័ន្ធ

បច្ចេកវិទ្យាទប់ស្កាត់លុប ឬការពារធាតុទិន្នន័យដែលមិនឆ្លើយតបនឹងការការពារឯកជនភាព ប៉ុន្តែមិនបោះពុម្ពពួកវាទេ។

- ការបិទបាំង៖ វាសំដៅលើវិធីសាស្ត្រ desensitization ទូទៅបំផុតដើម្បីបិទបាំងតម្លៃគុណលក្ខណៈ ដូចជាលេខគូប្រជែង អត្តសញ្ញាណប័ណ្ណត្រូវបានសម្គាល់ដោយសញ្ញាផ្កាយ ឬអាសយដ្ឋានត្រូវបានកាត់ឱ្យខ្លី។

- ការបង្ក្រាបក្នុងតំបន់៖ សំដៅលើដំណើរការនៃការលុបតម្លៃគុណលក្ខណៈជាក់លាក់ (ជួរឈរ) ការដកវាលទិន្នន័យដែលមិនសំខាន់ចេញ។

- ការទប់ស្កាត់ការកត់ត្រា៖ សំដៅលើដំណើរការនៃការលុបកំណត់ត្រាជាក់លាក់ (ជួរ) ការលុបកំណត់ត្រាទិន្នន័យដែលមិនសំខាន់។

(៤). បច្ចេកវិទ្យាឈ្មោះក្លែងក្លាយ

Pseudomanning គឺជាបច្ចេកទេសកំណត់អត្តសញ្ញាណដែលប្រើឈ្មោះក្លែងក្លាយដើម្បីជំនួសអត្តសញ្ញាណដោយផ្ទាល់ (ឬឧបករណ៍កំណត់អត្តសញ្ញាណរសើបផ្សេងទៀត)។ បច្ចេកទេសដាក់ឈ្មោះក្លែងក្លាយបង្កើតការកំណត់អត្តសញ្ញាណតែមួយគត់សម្រាប់ប្រធានបទព័ត៌មានបុគ្គលនីមួយៗ ជំនួសឱ្យការកំណត់អត្តសញ្ញាណផ្ទាល់ ឬរសើប។

- វាអាចបង្កើតតម្លៃចៃដន្យដោយឯករាជ្យ ដើម្បីឆ្លើយតបទៅនឹងលេខសម្គាល់ដើម រក្សាទុកតារាងផែនទី និងគ្រប់គ្រងយ៉ាងតឹងរ៉ឹងនូវការចូលទៅកាន់តារាងផែនទី។

- អ្នកក៏អាចប្រើការអ៊ិនគ្រីបដើម្បីបង្កើតឈ្មោះក្លែងក្លាយ ប៉ុន្តែត្រូវរក្សាសោការឌិគ្រីបឱ្យបានត្រឹមត្រូវ។

បច្ចេកវិទ្យានេះត្រូវបានគេប្រើយ៉ាងទូលំទូលាយនៅក្នុងករណីនៃអ្នកប្រើប្រាស់ទិន្នន័យឯករាជ្យមួយចំនួនធំ ដូចជា OpenID នៅក្នុងសេណារីយ៉ូវេទិកាបើកចំហ ដែលអ្នកអភិវឌ្ឍន៍ផ្សេងៗគ្នាទទួលបាន Openids ផ្សេងគ្នាសម្រាប់អ្នកប្រើប្រាស់ដូចគ្នា។

(៥). បច្ចេកទេសទូទៅ

បច្ចេកទេសទូទៅសំដៅទៅលើបច្ចេកទេសកំណត់អត្តសញ្ញាណដែលកាត់បន្ថយភាពលម្អិតនៃគុណលក្ខណៈដែលបានជ្រើសរើសនៅក្នុងសំណុំទិន្នន័យ និងផ្តល់នូវការពិពណ៌នាទូទៅ និងអរូបីនៃទិន្នន័យ។ បច្ចេកវិទ្យាទូទៅមានភាពងាយស្រួលក្នុងការអនុវត្ត និងអាចការពារភាពត្រឹមត្រូវនៃទិន្នន័យកម្រិតកំណត់ត្រា។ វាត្រូវបានគេប្រើជាទូទៅនៅក្នុងផលិតផលទិន្នន័យ ឬរបាយការណ៍ទិន្នន័យ។

- ការបង្គត់៖ ពាក់ព័ន្ធនឹងការជ្រើសរើសមូលដ្ឋានមូលសម្រាប់គុណលក្ខណៈដែលបានជ្រើសរើស ដូចជាការឡើងលើ ឬចុះក្រោម ការធ្វើកោសល្យវិច្ច័យ លទ្ធផល 100, 500, 1K និង 10K

- បច្ចេកទេសសរសេរកូដខាងលើ និងខាងក្រោម៖ ជំនួសតម្លៃខាងលើ (ឬខាងក្រោម) កម្រិតចាប់ផ្ដើមជាមួយនឹងកម្រិតដែលតំណាងឱ្យកម្រិតកំពូល (ឬខាងក្រោម) ដែលផ្តល់លទ្ធផលនៃ "ខាងលើ X" ឬ "ខាងក្រោម X"

(៦). បច្ចេកទេសចៃដន្យ

ជាប្រភេទនៃបច្ចេកទេស de-identification បច្ចេកវិទ្យា randomization សំដៅលើការកែប្រែតម្លៃនៃ attribute តាមរយៈការចៃដន្យ ដូច្នេះតម្លៃបន្ទាប់ពីការចៃដន្យគឺខុសពីតម្លៃពិតដើម។ ដំណើរការនេះកាត់បន្ថយសមត្ថភាពរបស់អ្នកវាយប្រហារក្នុងការទាញយកតម្លៃ attribute ពីតម្លៃ attribute ផ្សេងទៀតនៅក្នុងកំណត់ត្រាទិន្នន័យដូចគ្នា ប៉ុន្តែប៉ះពាល់ដល់ភាពត្រឹមត្រូវនៃទិន្នន័យលទ្ធផល ដែលជារឿងធម្មតាជាមួយទិន្នន័យសាកល្បងផលិតកម្ម។


ពេលវេលាប្រកាស៖ ថ្ងៃទី ២៧ ខែកញ្ញា ឆ្នាំ ២០២២