Opis
The data set contains about 120,000 Polish words and sentences and their translations into Kashubian. It was created using two types of sources. The first one is the online dictionaries:
The second type of source was an existing dataset that was incorporated into this one:
The dataset was pre-cleaned and duplicates were removed.
Plik z danymi badawczymi
Polish-Kashubian parallel translation corpus.zip
814.0 kB,
S3 ETag
44810ca14f445862b0bbd85c3fa03ec7-1,
pobrań: 2
Hash pliku liczony jest ze wzoru
Przykładowy skrypt do wyliczenia:
https://github.com/antespi/s3md5
hexmd5(md5(part1)+md5(part2)+...)-{parts_count}
gdzie pojedyncza część pliku jest wielkości 512 MBPrzykładowy skrypt do wyliczenia:
https://github.com/antespi/s3md5
Informacje szczegółowe o pliku
- Licencja:
-
otwiera się w nowej karcieCC 0Przekazanie do Domeny Publicznej
Informacje szczegółowe
- Rok publikacji:
- 2024
- Data zatwierdzenia:
- 2025-02-01
- Język danych badawczych:
- polski
- Dyscypliny:
-
- informatyka techniczna i telekomunikacja (Dziedzina nauk inżynieryjno-technicznych)
- DOI:
- Identyfikator DOI 10.34808/5whb-dk74 otwiera się w nowej karcie
- Seria:
- Weryfikacja:
- Politechnika Gdańska
Słowa kluczowe
Powiązane zasoby
Cytuj jako
Autorzy
Wersja ten dokument posiada różne wersje
-
Aktualna wersjawersja 2.0Data publikacji wersji 2025-02-01
-
wersja 1.0Data publikacji wersji 2024-09-30
DOI
10.34808/4sbd-2v21
reprezentuje ostatnią wersję danych.
wyświetlono 19 razy