Data Masking
PII detection and masking for transcripts and text data
PII Categories
Names
<NAME>
Phone Numbers
<PHONE>
Email Addresses
<EMAIL>
Physical Addresses
<ADDRESS>
ID Numbers
<ID>
Dates of Birth
<DOB>
Processing Options
Translate Lithuanian → English
Translates Lithuanian text to English before PII detection for improved accuracy.
Ollama-based local model for PII detection. Larger models have better accuracy.
Processing Pipeline
Chunk Text
0.3s
Detect PII
1.2s
Mask Numbers
0.4s
Mask Addresses
0.5s
5
Validate
0.2s
6
Translate
—
Original Text
Masked Output
[0:00] Agentas: Laba diena, dėkojame, kad skambinate TeleCom Solutions. Kuo galiu padėti?
[0:06] Klientas: Laba diena, mano vardas <NAME>. Turiu problemą su sąskaita.
[0:14] Agentas: Supratau, pone <NAME>. Galite pasakyti savo sąskaitos numerį?
[0:20] Klientas: Taip, tai <ID>. Ir mano telefonas <PHONE>.
[0:28] Agentas: Ačiū. Matau dvigubą mokėjimą. Grąžinsiu pinigus per 3-5 darbo dienas.
PII Detected
7
Tokens Processed
342
Confidence
94.2%