Banner trang chủ
Thứ Ba, ngày 19/11/2024

Giải thuật tích hợp thủy vân bảo vệ bản quyền dữ liệu bản đồ vector lĩnh vực môi trường

12/12/2022

Tóm tắt

    Dữ liệu bản đồ vector là một trong những loại thông tin, dữ liệu chính của ngành Tài nguyên và Môi trường. Đây cũng là một trong những loại dữ liệu mà chi phí để tạo ra nó tương đối lớn bởi những khó khăn trong việc đo đạc, thu thập và biên tập thông tin. Sự phát triển nhanh chóng của Internet đã tạo ra nhiều ưu điểm trong việc phân phối, khai thác và sử dụng các dữ liệu bản đồ vector, tuy nhiên nó cũng làm phát sinh nhiều vấn đề như nhân bản, phát tán, giả mạo, và sử dụng dữ liệu bất hợp pháp. Các hành vi trộm cắp trên Internet ngày càng trở nên tinh vi và số lượng các vụ vi phạm ngày càng nhiều cho thấy nhu cầu cấp thiết cần nghiên cứu và phát triển một giải pháp hiệu quả để bảo vệ bản quyền dữ liệu bản đồ vector và ngăn chặn chúng bị thu thập, sử dụng bất hợp pháp. Trong số các nghiên cứu và giải pháp chính, thủy vân số nổi lên như là một phương pháp hiệu quả và đang là một lĩnh vực nghiên cứu tích cực để bảo vệ bản quyền các dữ liệu bản đồ vector. Các biến đổi, tấn công dữ liệu vô tình hay cố ý rất đa dạng nhưng các giải pháp thủy vân hiện tại mới chỉ bảo vệ được dữ liệu bản đồ vector trước một số tấn công hay biến đổi nhất định. Hướng tới một giải pháp tốt cho việc bảo vệ bản quyền dữ liệu bản đồ vector lĩnh vực môi trường, bài báo này trình bày một giải thuật tích hợp hai loại thủy vân gồm thủy vân nhúng vào tọa độ các đỉnh và thủy vân rỗng dựa trên đặc tính thống kê để tạo nên một giải thuật bảo vệ bản quyền dữ liệu bản đồ vector bền vững trước nhiều tấn công hay biến đổi dữ liệu như thêm, sửa xóa các đỉnh (vertex), thêm, sửa xóa các đối tượng (feature), cắt xén (crop), nén (simplify), chuyển hệ tọa độ (transform), dịch chuyển (translate), tỷ lệ (scale) hay xoay (rotate). Giải thuật cho phép làm việc trên tất cả các dạng dữ liệu bản đồ vector, gồm dạng điểm, dạng đường, và dạng vùng.

Từ khóa: Bảo vệ bản quyền, thủy vân số, dữ liệu bản đồ vector, thủy vân rỗng.

Nhận bài: 14/11/2022; Sửa chữa: 24/11/2022; Duyệt đăng: 28/11/2022.

1. Mở đầu

    Bảo vệ bản quyền là một khái niệm có nội dung rất rộng và do đó có rất nhiều các giải pháp hay kỹ thuật bảo vệ bản quyền. Mỗi kỹ thuật cũng thường chỉ bảo vệ được quyền của tác giả trước một số hành động tấn công nhất định. Các kỹ thuật bảo vệ bản quyền có thể được chia thành 2 nhóm: các kỹ thuật đề phòng (precaution); và các kỹ thuật giải trình (accountability)[1]. Các kỹ thuật đề phòng thực hiện các biện pháp phòng thủ như mã hóa dữ liệu hay kiểm soát truy cập người dùng để ngăn chặn những người dùng không hợp lệ tiếp cận với dữ liệu, hay có tiếp cận thì cũng không khai thác, sử dụng được dữ liệu. Các kỹ thuật giải trình thực hiện việc hậu kiểm, nghĩa là khi có sự nghi ngờ, có thể kiểm tra, đối chiếu để có thể chứng minh bản quyền với dữ liệu.

    Thủy vân số là kỹ thuật giải trình mà quy trình thực hiện là: (1) “nhúng” thông tin bản quyền (gọi là thủy vân) vào dữ liệu; (2) phân phối dữ liệu tới người dùng và giả thiết dữ liệu sẽ chịu những dạng tấn công (hay biến đổi) nhất định; và (3) trích thông tin bản quyền từ dữ liệu (đã nhúng thủy vân) để chứng minh bản quyền. Các kỹ thuật thủy vân phụ thuộc rất nhiều vào đối tượng cần bảo vệ bản quyền (được nhúng thủy vân) do đặc tính khác nhau của các đối tượng này.

    Dữ liệu bản đồ vector, còn được gọi là dữ liệu địa lý hay địa không gian vector, thể hiện các thuộc tính không gian và phi không gian của các đối tượng có vị trí địa lý trên trái đất. Thông thường dữ liệu bản đồ vector được tổ chức thành một hay nhiều lớp (layer), mỗi lớp thường thể hiện một loại đối tượng có thuộc tính không gian dạng điểm, dạng đường, hay dạng vùng. Bản đồ thường được xây dựng bằng cách chồng xếp các lớp dữ liệu này. Các định dạng chính của dữ liệu bản đồ vector có thể kể đến là: shapefile (.shp), geojson (.json), GeoPackage (.gpkg), hay GeoDatabase.

    Mặc dù, số lượng các nghiên cứu về thủy vân số bảo vệ bản quyền dữ liệu bản đồ vector trong những năm gần đầy đã khá nhiều nhưng vẫn là ít hơn rất nhiều so với các nghiên cứu về thủy vân số bảo vệ bản quyền dữ liệu đa phương tiện. Nguyên nhân có thể là do sự phổ biến hơn của dữ liệu đa phương tiện, và cũng có thể do những khó khăn đến từ bản chất của dữ liệu bản đồ vector (như cấu trúc dữ liệu, mục đích phục vụ phân tích…). Thêm nữa hầu hết các nghiên cứu gần đây được xuất bản bởi các nhóm nghiên cứu nước ngoài, hầu như không có nghiên cứu xuất phát từ Việt Nam.

    Để phục vụ mục đích bảo vệ bản quyền, thủy vân cần đảm bảo tính bền vững trước các biến đổi, tấn công vô tình hay cố ý. Tuy nhiên mỗi kỹ thuật thủy vân hiện tại chỉ mới bền vững trước một số dạng tấn công, do đó một giải pháp tích hợp là cần thiết để tăng khả năng bền vững của thủy vân trước nhiều dạng tấn công. Bài báo này sẽ trình bày những kết quả nghiên cứu của chúng tôi để hình thành một giải thuật tích hợp giữa thủy vân dựa trên miền không gian (cụ thể là thủy vân nhúng vào tọa độ các đỉnh) và thủy vân rỗng (cụ thể là thủy vân rỗng dựa trên các đặc tính thống kê) tạo nên một thủy vân bền vững hơn phục vụ mục đích bảo vệ bản quyền dữ liệu bản đồ vector.

2. Phương pháp luận

2.1. Quy trình thủy vân bảo vệ bản quyền

    Việc bảo vệ bản quyền dữ liệu dựa trên thủy vân được thực hiện bằng cách thực hiện một số thao tác lên dữ liệu trước khi chuyển giao dữ liệu tới người sử dụng. Công việc này gọi chung là nhúng thủy vân mà bao gồm hai bước: (1) sinh thủy vân và (2) nhúng thủy vân. Thủy vân được sinh ra từ thông tin bản quyền và một số thông tin khác (thí dụ thông tin về người dùng). Trong một số trường hợp (thí dụ thủy vân rỗng) thủy vân được sinh ra còn dựa vào chính dữ liệu sẽ được bảo vệ bản quyền. Để tăng thêm tính bảo mật, thủy vân thường được xóa trộn và có thể mã hóa bởi một giải thuật mã hóa sử dụng khóa [2]. Thủy vân được lưu trữ và trong trường hợp thủy vân rỗng, thủy vân có thể được gửi tới một bên chứng thực tin cậy. Thủy vân sau đó được nhúng vào dữ liệu bản đồ vector để tạo ra một sản phẩm sẵn sàng chuyển giao tới người sử dụng. Quy trình nhúng thủy vân bảo vệ bản quyền được thể hiện trong hình sau:

Hình 1. Quy trình nhúng thủy vân bảo vệ bản quyền

    Dữ liệu bản đồ vector đã nhúng thủy vân được chuyển giao tới người sử dụng và giả thiết chịu một số biến đổi, tấn công vô tình hay cố ý. Khi cần chứng minh bản quyền, quy trình trích thủy vân chứng minh bản quyền được thực hiện. Quy trình này thường bao gồm việc phát hiện xem dữ liệu có chứa thủy vân không rồi sau đó mới trích thủy vân để chứng minh bản quyền. Đầu vào của quy trình là dữ liệu bản đồ vector cần xác minh bản quyền và trong một số trường hợp có thể cần cả thủy vân và dữ liệu bản đồ vector gốc. Thủy vân trích được cũng cần khóa để giả mã và đọc ra thông tin bản quyền. Quy trình trích thủy vân được thể hiện trong hình sau:

Hình 2. Quy trình trích thủy vân để xác minh bản quyền

2.2. Phân tích các kỹ thuật thủy vân

    Dựa trên miền dữ liệu nhúng cũng như các yêu cầu về độ chính xác của dữ liệu được nhúng thủy vân, các kỹ thuật thủy vân được chia thành nhiều loại như thủy vân dựa trên miền không gian, thủy vân dựa trên miền tần số, thủy vân thuận nghịch, thủy vân không mất mát thông tin, và thủy vân rỗng. Các nghiên cứu về thủy vân sử dụng kỹ thuật nhúng thông tin vào miền không gian (tọa độ của các đối tượng) có thể kể đến là [3, 4], các kỹ thuật nhúng thông tin vào miền tần số như [5]. Các nghiên cứu về thủy vân thuận nghịch cho dữ liệu bản đồ vector như [6, 7]. Các nghiên cứu về thủy vân không mất mát thông tin dựa trên thứ tự lưu trữ như [8]. Các nghiên cứu về thủy vân rỗng như [9-11].

    Các giải thuật thủy vân thường cố nhúng một thông tin nào đó (gọi là thủy vân) vào dữ liệu nhằm mục đích bảo vệ dữ liệu bằng cách phục vụ việc trích lại thông tin thủy vân để chứng minh bản quyền của người chủ sở hữu. Việc nhúng cơ bản dựa trên nguyên tắc tìm không gian dư thừa trong dữ liệu để có thể chèn thủy vân vào mà không hoặc ít ảnh hưởng tới dữ liệu cần bảo vệ. Các kỹ thuật chèn hay ẩn một thông tin vào một thông tin khác được sử dụng chủ yếu hiện này là các kỹ thuật điều chế giải phổ, bít ít ý nghĩa nhất, hay điều chế chỉ mục lượng tử [12]. Cũng lưu ý là thủy vân không nhất thiết phải nhúng vào dữ liệu mang và các kỹ thuật loại này được gọi là thủy vân rỗng.

    Dựa trên mức độ bền vững của thủy vân trước các tác động lên dữ liệu đã được thủy vân mà các giải thuật thủy vân có thể được phân thành thủy vân bền vững (robust) và thủy vân dễ vỡ (fragile). Các thủy vân bền vững hữu dụng cho việc bảo vệ bản quyền trong khi các thủy vân dễ vỡ hữu dụng cho các vấn đề bảo vệ sự toàn vẹn và xác thực. Căn cứ khả năng nhìn thấy thủy vân trực quan trên dữ liệu đã được thủy vân, các kỹ thuật thủy vân được phân thành thủy vân hiện và thủy vân ẩn. Đối với các dữ liệu đa phương tiện như ảnh hay văn bản, thủy vân hiện là cách thức hiệu quả để xác định tường minh bản quyền đối với dữ liệu. Tuy nhiên, đối với dữ liệu bản đồ vector, bên cạnh việc phục vụ trình bày trực quan, dữ liệu còn phục vụ nhiều phép phân tích không gian nên thủy vân trên dữ liệu bản đồ vector chủ yếu là thủy vân ẩn. Dựa trên kỹ thuật chèn thủy vân vào dữ liệu có thể phân các giải thuật thủy vân thành thủy vân dựa trên miền không gian và thủy vân dựa trên miền tần số. Các thủy vân dựa trên miền không gian tìm cách chèn thủy vân vào các tọa độ đỉnh hay quan hệ của các đối tượng hình học còn các thủy vân dựa trên miền tần số tìm cách chuyển các thông tin hình học từ miền không gian sang miền tần số sử dụng các phép biến đổi như biến đổi Fourier, Cosine hay sóng lăn tăn (wavelet) rồi chèn thủy vân vào các hệ số sau đó chuyển ngược lại miền không gian sử dụng các phép biến đổi ngược tương ứng. Dựa trên việc có cần dữ liệu gốc để xác định thủy vân trên dữ liệu đã được thủy vân hay không, các giải thuật thủy vân được chia thành thủy vân mù (blind) và thủy vân không mù (non-blind). Với thủy vân mù, việc trích thông tin thủy vân chỉ cần chính dữ liệu đã được thủy vân, còn với thủy vân không mù, để trích thông tin thủy vân cần cả dữ liệu gốc chưa chèn thủy vân.

    Dựa trên mức độ ảnh hưởng cũng như khả năng khôi phục dữ liệu gốc từ dữ liệu đã nhúng thủy vân, các giải thuật thủy vân được phân thành thủy vân mất mát thông tin và thủy vân không mất mát thông tin (lossless). Các thủy vân thông thường làm biến dạng dữ liệu gốc và trong một số trường hợp có thể là không thể chấp nhận được (thí dụ trong các lĩnh vực đo đạc, bản đồ, quân sự). Thủy vân không mất mát thông tin cố gắng bảo toàn dữ liệu gốc và như vậy phù hợp với các ứng dụng bảo vệ bản quyền cho các dữ liệu vector độ chính xác cao.

    Theo phân tích trong [8], các nghiên cứu hiện tại của thủy vân không mất mát thông tin cho dữ liệu vector có thể được chia thành 3 loại chính. Loại thứ nhất là thủy vân thuận nghịch (reversible). Các kỹ thuật thủy vân thuận nghịch nhúng thủy vân vào dữ liệu gốc và người dùng phải trích thủy vân trước khi sử dụng dữ liệu. Bởi đòi hỏi tách thủy vân khỏi dữ liệu trước khi sử dụng, thủy vân thuận nghịch không phù hợp cho mục đích bảo vệ bản quyền.

    Loại thủy vân không mất mát thông tin thứ hai là thủy vân rỗng (zero-watermarking). Đây là các kỹ thuật thủy vân đặc biệt vì thực sự các kỹ thuật này không nhúng bất kỳ thông tin nào vào dữ liệu gốc mà cố gắng tìm các đặc trưng của dữ liệu gốc để sau đó khi có tranh chấp bản quyền sẽ sử dụng đặc trưng đó để chứng minh. Để đảm bảo khả năng chứng minh bản quyền, các đặc trưng tìm được thường cần được đăng ký với một bên tin cậy, có thẩm quyền. Tuy có nhược điểm là cần sử dụng bên thứ ba trong quy trình bảo vệ bản quyền nhưng các kỹ thuật thủy vân rỗng có một ưu điểm lớn là nó có thể dễ dàng kết hợp với các loại thủy vân khác để gia tăng bằng chứng xác thực bản quyền.

    Loại thủy vân thứ ba là thủy vân dựa trên đặc trưng lưu trữ. Các kỹ thuật này nhúng thông tin thủy vân bằng cách biến đổi thứ tự lưu trữ của dữ liệu đường mà không thay đổi các giá trị tọa độ. Với phương pháp này, hướng lưu trữ của một đường được lượng tử bởi 0 hay 1 tương ứng với đặc trưng lưu trữ của đường đó. Để nhúng thông tin thủy vân, ta xem xét xem thông tin thủy vân được nhúng có nhất quán với giá trị lượng tử của hướng lưu trữ không. Nếu chúng giống nhau, thứ tự lưu trữ của đường đó không thay đổi. Ngược lại, thứ tự lưu trữ của đường đó được thay đổi ngược lại. Thủy vân dựa trên đặc trưng lưu trữ sử dụng cấu trúc dữ liệu đường, do đó chỉ làm việc được với dữ liệu dạng đường và dạng vùng.

    Bản thân thủy vân có thể được phân lớp vào hai nhóm là thủy vân có ý nghĩa và thủy vân không ý nghĩa. Thủy vân có ý nghĩa thường là các ảnh logo mà có thể dễ dàng kiểm tra trực quan khi được trích ra, trong khi thủy vân không có ý nghĩa thường được thể hiện như một chuỗi “giả ngẫu nhiên” các bít. Việc phát hiện sự xuất hiện của thủy vân không ý nghĩa thường sử dụng các tương quan thống kê (thí dụ chỉ số Normalized Correlation). Thêm nữa, thủy vân không ý nghĩa thường ngắn hơn nhiều so với thủy vân có ý nghĩa, do đó thủy vân không ý nghĩa thường được dùng hơn cho các tập dữ liệu nhỏ.

    Để tăng tính bền vững của kỹ thuật thủy vân và đảm bảo an toàn cho thông tin thủy vân, các thông tin thủy vân thường được xáo trộn và có thể mã hóa bởi một hệ mật trước khi được nhúng vào dữ liệu.

3. Giải thuật tích hợp thủy vân

    Giải thuật tích hợp thủy vân bảo vệ bản quyền dữ liệu bản đồ vector được đề xuất bao gồm thủy vân miền không gian, nhúng thủy vân vào tọa độ các đỉnh của dữ liệu và thủy vân rỗng dựa trên đặc tính thống kê. Với việc chọn đối tượng nhúng là các đỉnh, thủy vân này có khả năng nhúng trên tất cả các dạng dữ liệu bản đồ vector gồm dạng điểm, dạng đường, và dạng vùng. Thêm nữa trong một tập dữ liệu, số lượng các đỉnh thường nhiều hơn nhiều so với số lượng các đối tượng, do đó thủy vân này cho phép nhúng mỗi bít thủy vân nhiều lần, từ đó tăng tính bền vững của thủy vân.

3.1. Thủy vân nhúng vào các đỉnh

    Thủy vân nhúng trong giải thuật dựa trên kỹ thuật thủy vân nhúng các bít thủy vân vào giá trị tọa độ các đỉnh được đề xuất bởi Wang và cộng sự [3]. Kỹ thuật thủy vân này xác định bít thủy vân nào sẽ được nhúng vào một đỉnh và sau đó nhúng bít đó vào các tọa độ đỉnh dựa trên kỹ thuật lượng tử hóa.

    Giả sử thông tin thủy vân là , với  là bít thủy vân,  là chỉ mục bít thủy vân,  là chiều dài thủy vân, và . Giải thuật sẽ nhúng mỗi bít của thủy vân  này vào các đỉnh của dữ liệu bản đồ vector.

Nhúng thủy vân

    Dữ liệu bản đồ vector chứa các tọa độ đỉnh (vertex). Các tọa độ đỉnh là thành phần nền tảng của các điểm, các đường, các vùng mà là các lớp đối tượng cơ bản trong dữ liệu bản đồ vector. Để có được một giải thuật thủy vân mạnh trước các tấn công phổ biến như cắt dữ liệu, đảo thứ tự dữ liệu, đơn giản hóa (nén) dữ liệu, thêm đỉnh, xóa đỉnh, ta cần thiết lập một ánh xạ quan hệ giữa tọa độ đỉnh và chỉ mục bít thủy vân, và bít thủy vân sẽ được nhúng vào tọa độ đỉnh tương ứng theo ánh xạ quan hệ này.

    Giả sử các tọa độ đỉnh của dữ liệu địa lý vector là tập , với  là đỉnh thứ ,  là tọa độ của đỉnh thứ , và  là số đỉnh. Chi tiết các bước để thiết lập ánh xạ quan hệ như sau:

    Các tọa độ đỉnh  được ánh xạ vào miền , với kích thước theo phương trình

với là tọa độ được ánh xạ,  là hệ số tỷ lệ được sử dụng để điều khiển các biến dạng trong việc nhúng thủy vân.

    Vùng R lại được chia thành  ô lưới và bằng cách thiết lập ánh xạ quan hệ giữa tọa độ  và chỉ mục ô lưới  sử dụng phương trình sau:

với Nc, Nr, LDx, LDy là các số nguyên dương,  và . Thêm nữa 

    Chỉ mục hai chiều của ô lưới  được ánh xạ tới chỉ mục một chiều của bít thủy vân theo phương trình .

    Theo các bước trên, ánh xạ quan hệ nhiều-một được thiết lập giữa tọa độ đỉnh và chỉ mục bít thủy vân. Các bít thủy vân được nhúng vào các tọa độ đỉnh tương ứng sử dụng kỹ thuật lượng tử hóa để đảm bảo khả năng phát hiện mù các bít thủy vân. Trong đại đa số trường hợp, số tọa độ đỉnh nhiều hơn nhiều so với chiều dài thủy vân, và do đó dẫn tới ánh xạ quan hệ nhiều-một giữa các tọa độ đỉnh và chỉ mục bít thủy vân và kết quả là một chỉ mục bít thủy vân tương ứng với nhiều bít thủy vân được trích.

Trích thủy vân

    Thủy vân được trích theo quy trình ngược với quy trình nhúng thủy vân. Các bước chính để trích thủy vân như sau: với các tọa độ đỉnh nào đó, bít thủy vân được trích từ  sử dụng giải thuật lượng tử hóa, và chỉ mục cho bít thủy vân được trích được tính toán dựa trên hàm ánh xạ được thiết lập.

    Giả sử các bít thủy vân được trích là tập hợp  và  với  là bít thủy vân được trích thứ j của chỉ mục bít thủy vân thứ i, N, là chiều dài thủy vân, Li thể hiện số bít thủy vân được trích tương ứng với chỉ mục bít thủy vân thứ i, N và M là số đỉnh. Thêm nữa  và .

    Nguyên tắc cơ bản của giải thuật phát hiện thủy vân là: Trước hết tính thủy vân  với chiều dài cố định N dựa trên các bít thủy vân đã trích , sau đó tính hệ số tương quan giữa  và thủy vân gốc W để phán quyết liệu thủy vân có chứa trong dữ liệu không. Thủy vân  được xác định bằng cách tính  rồi tính  theo phương trình

3.2. Thủy vân rỗng dựa trên các đặc tính thống kê

    Thủy vân rỗng không nhúng thủy vân vào dữ liệu bản đồ vector mà tính các đặc trưng ổn định của dữ liệu rồi sau đó có thể được sử dụng để chứng minh bản quyền của dữ liệu. Giải thuật sử dụng kỹ thuật thủy vân rỗng dựa trên các đặc tính thống kê được đề xuất bởi Xun và cộng sự [10]. Giải thuật chia bản đồ thành các vòng và đếm số đỉnh trong mỗi vòng. Cũng bởi dựa trên các đỉnh, giải thuật có thể làm việc trên tất cả các dạng dữ liệu bản đồ vector gồm dạng điểm, dạng đường, và dạng vùng. Thêm nữa khi làm việc với dữ liệu đỉnh, số đỉnh trong các tập dữ liệu thường lớn hơn nhiều so với số các đối tượng  của tập dữ liệu, do đó các đặc tính thống kê thường có tính bền vững hơn.

Nhúng thủy vân rỗng

    Nhúng thủy vân rỗng thực chất là quá trình sinh thủy vân. Trước hết tính tọa độ điểm trung tâm, và khoảng cách trung bình, , của tất cả các đỉnh của tập dữ liệu bản đồ vector tới điểm trung tâm.

với M là số đỉnh của tập dữ liệu bản đồ vector.

    Tiếp theo, thiết kế một vòng tròn mà tâm là  và bán kính là hai lần . Chia vòng tròn này thành một số khuyên bởi các vòng tròn đồng tâm. Số các khuyên là kích thước của thủy vân, N.

    Cuối cùng, đếm số các đỉnh trong mỗi khuyên và xem như tính chất thống kê của dữ liệu bản đồ vector. Dữ liệu này được lưu vào một mảng Z  với chiều dài N.

    Tính số trung bình của các đỉnh trong các khuyên gọi là . Tính mảng  theo công thức

    Thủy vân rỗng  được tính bằng phép XOR giữa  và thông tin bản quyền W

Trích thủy vân rỗng

    Để trích thủy vân rỗng, trước tiên dựa vào dữ liệu bản đồ vector được bảo vệ, ta có được thủy vân rỗng  từ bên chứng thực có thẩm quyền. Tiếp theo, dựa vào chiều dài của I, dữ liệu bản đồ vector được chia thành các khuyên rồi đếm số đỉnh trong mỗi khuyên để tính  như trong giải thuật sinh thủy vân rỗng. Thông tin thủy vân rỗng được tính theo công thức

3.3. Giải thuật tích hợp thủy vân bảo vệ bản quyền

    Giải thuật bao gồm hai quá trình, quá trình nhúng thủy vân và quá trình trích thủy vân từ các dữ liệu bản đồ vector cần xác thực bản quyền.

Các bước nhúng thủy vân

    Bước 1. Chuyển thông tin bản quyền từ dạng văn bản sang dạng ảnh nhị phân;

    Bước 2. Xáo trộn ảnh bản quyền và mã hóa ảnh bản quyền;

    Bước 3. Nhúng ảnh bản quyền vào dữ liệu sử dụng giải thuật thủy vân nhúng vào tọa độ đỉnh;

    Bước 4. Tạo thủy vân rỗng theo giải thuật thủy vân rỗng dựa trên các đặc tính thống kê và gửi cho bên chứng thực thẩm quyền.

Các bước trích thủy vân để chứng minh bản quyền

    Bước 1. Trích thủy vân theo giải thuật thủy vân nhúng vào tọa độ đỉnh. Nếu thông tin bản quyền đã đủ chứng minh quyền bản quyền thì kết thúc;

    Bước 2. Trích thủy vân theo giải thuật thủy vân rỗng dựa trên các đặc trưng thống kê, nếu thông tin bản quyền đã đủ chứng minh quyền bản quyền thì kết thúc;

    Ngược lại kết luận không có đủ bằng chứng xác định bản quyền.

4. Thử nghiệm

    Chúng tôi thử nghiệm giải thuật trên dữ liệu địa giới hành chính mức tỉnh (a), dữ liệu đường giao thông chính (b) và dữ liệu các điểm dân cư chính (c) để chứng tỏ khả năng làm việc của giải thuật đối với tất cả các dạng dữ liệu bản đồ vector.

 

(a)

 

(b)

(c)

Hình 3. Dữ liệu thử nghiệm; (a) địa giới hành chính; (b) đường giao thông chính; (c) các điểm dân cư chính

    Thông tin bản quyền là chuỗi “CEID”. Chuỗi thông tin bản quyền được chuyển thành ảnh bản quyền thể hiện mảng nhị phân hai chiều kích thước 

Hình 4. Ảnh bản quyền CEID

    Xáo trộn thông tin bản quyền sử dụng khóa (key/seed).

Hình 5. Thông tin bản quyền sau xáo trộn

    Nhúng thông tin bản quyền vào các dữ liệu thử nghiệm trên tạo ra các lớp dữ liệu bản đồ vector đã được nhúng thông tin bản quyền với mức sai số của tọa độ là 10-9 đơn vị. Thủ tục nhúng cũng tạo ra thủy vân rỗng tích hợp thông tin bản quyền tương ứng như được thể hiện trong các hình sau:

 

(a) 

 

(b) 

 

(c) 

Hình 6. Thủy vân rỗng kết hợp với thông tin bản quyền

    Các thủy vân rỗng kết hợp với thông tin bản quyền được đăng ký với một tổ chức chứng thực để phục vụ việc chứng minh bản quyền khi thông tin nhúng vào các đỉnh không đủ để khẳng định bản quyền.

    Với thông tin bản quyền được nhúng trong tọa độ các đỉnh của dữ liệu, giải thuật đạt được độ bền vững cao trước các tấn công xóa các đỉnh, xóa đối tượng, giản lược dữ liệu và cắt xén dữ liệu như đã được phân tích trong [3]. Ở đây chúng tôi thử nghiệm cắt xén một vùng quanh khu Hà Nội để phân tích khả năng thực tế của giải thuật.

 

(a) 

 

(b) 

 

(c) 

Hình 7. Trích thông tin bản quyền sau tấn công cắt xén dữ liệu

    Giải thuật thủy vân rỗng giúp bảo vệ thông tin bản quyền bền vững trước các tấn công dịch chuyển, tỷ lệ, quay, xáo trộn các đối tượng như được phân tích trong [10]. Ở đây chúng tôi thực hiện phép chuyển hệ tọa độ từ dữ liệu gốc sang hệ tọa độ phẳng VN-2000 để kiểm tra tính bền vững của thông tin bản quyền. Việc chuyển đổi hệ tọa độ hoàn toàn không làm thay đổi thông tin bản quyền khi xác thực bằng thủy vân rỗng.

 

(a) 

 

(b) 

 

(c) 

Hình 8. Trích thông tin bản quyền sau tấn công chuyển hệ tọa độ

5. Kết luận

    Giải thuật tích hợp hai loại thủy vân gồm thủy vân miền không gian và thủy vân rỗng đã cho phép thủy vân chống lại được nhiều hơn các dạng tấn công phổ biến hiện nay. Bằng cách sử dụng thủy vân có ý nghĩa và thể hiện trực quan dưới dạng ảnh bản quyền, giải thuật cho phép xác định bản quyền trực quan từ đó có nhiều hơn căn cứ xác minh bản quyền so với việc chỉ sử dụng các chỉ số thống kê.

Giải thuật đã được thể hiện thành mã chương trình sử dụng ngôn ngữ Python có thể dễ dàng triển khai vào ứng dụng thực tế.

Lời cảm ơn: Bài báo này sử dụng kết quả nghiên cứu của các tác giả khi thực hiện đề tài “Nghiên cứu xây dựng công nghệ xác thực dữ liệu số tài nguyên và môi trường có thu phí”, (mã số TNMT.2022.04.07).

Tài liệu tham khảo

[1] Wang, X., Yan, H., Zhang, L., Zhang, X., & Li, P. (2021). An encryption algorithm for vector maps based on the Gaussian random and Haar transform. Journal of Spatial Science, 1-16.

[2] Mondal, B. (2018). Cryptographic image scrambling techniques. In Cryptographic and Information Security (pp. 37-65). CRC Press.

[3] Wang, Y., Yang, C., Ren, N., Zhu, C., Rui, T., & Wang, D. (2020). An adaptive watermark detection algorithm for vector geographic data. KSII Transactions on Internet and Information Systems (TIIS), 14(1), 323-343.

[4] Yan, H., Zhang, L., & Yang, W. (2017). A normalization-based watermarking scheme for 2D vector map data. Earth Science Informatics, 10(4), 471-481.

[5] Zope-Chaudhari, S., Venkatachalam, P., & Buddhiraju, K. M. (2017, July). Copyright protection of vector data using vector watermark. In 2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS) (pp. 6110-6113). IEEE.

[6] Hou, X., Min, L., & Yang, H. (2018). A reversible watermarking scheme for vector maps based on multilevel histogram modification. Symmetry, 10(9), 397.

[7] Qiu, Y., Duan, H., Sun, J., & Gu, H. (2019). Rich-information reversible watermarking scheme of vector maps. Multimedia Tools and Applications, 78(17), 24955-24977.

[8] Ren, N., Zhou, Q., Zhu, C., Zhu, A. X., & Chen, W. (2020). A Lossless Watermarking Algorithm Based on Line Pairs for Vector Data. Ieee Access, 8, 156727-156739.

[9] Li, A. B., & Zhu, A. X. (2019). Copyright authentication of digital vector maps based on spatial autocorrelation indices. Earth Science Informatics, 12(4), 629-639.

[10] Xun, W. A. N. G., Huang, D., & Zhang, Z. (2012). A robust zero-watermarking algorithm for vector digital maps based on statistical characteristics. Softw. Appl. Econ. Anal. Bus. Manag, 7, 2349.

[11] Zhou, Q., Zhu, C., Ren, N., Chen, W., & Gong, W. (2021). Zero Watermarking Algorithm for Vector Geographic Data Based on the Number of Neighboring Features. Symmetry, 13(2), 208.

[12] Moulin, P., & Koetter, R. (2005). Data-hiding codes. Proceedings of the IEEE, 93(12), 2083-2126.

Lê Hải Hà, Nguyễn Đình Hân

Viện Toán ứng dụng và Tin học, Đại học Bách khoa Hà Nội

Nguyễn Văn Thùy, Lê Hoàng Anh

Trung tâm Thông tin và Dữ liệu môi trường, Tổng cục Môi trường

(Nguồn: Bài đăng trên Tạp chí Môi trường, số Chuyên đề Tiếng Việt IV/2022)

 

Watermarking integration algorithm of copyright protection for vector geographic data in the environmental field

Le Hai Ha,  Nguyen Dinh Han

School of Applied Mathematics and Informatics - HUST

Nguyen Van Thuy, Le Hoang Anh

Centre for Environmental Information and Data - VEA

ABSTRACT

    Vector geographic data is one of the main types of information, data of the natural resources and environment sector. This is also one of the types of data where the cost to create it is relatively large because of the difficulty in surveying, collecting and authorizing. The rapid development of the Internet has created many advantages in the distribution, exploitation and use of vector geographic data, but it also gives rise to many problems such as duplication, redistribution, forgery, and illegal data use. The theft on the Internet is becoming more and more sophisticated and the number of violations is increasing, showing the urgent need to research and develop an effective solution to protect the copyright of vector geographic data and prevent them from being illegally collected and used. Among the major researches and solutions, digital watermarking emerges as an effective method and is an active research area for copyright protection of vector geographic data. Attacks/modifications, intended or not, are very diverse, but current watermarking solutions can only protect vector geographic data against certain attacks. Towards a good solution for copyright protection of environmental vector geographic data, this paper presents an algorithm that integrates two types of watermarks, including embedded watermarks in the coordinates of vertices and zero watermarks based on statistical characteristics to create a robus vector geographic data copyright protection algorithm against many attacks such as adding, modifying and deleting vertices, adding, editing and deleting features, crop, compress (simplify), transform, translate, or rotate vector geographic data. The algorithm allows working on all types of vector geographic data, including points, lines, and polygons.

Keywords: Copyright protection, digital watermark, vector map data, zero-watermark.

Ý kiến của bạn