^
Siri po polsku nadzieja umiera ostatnia

Notacja polska, czyli dlaczego nigdy nie będziemy mieć Siri po polsku

Jaromir Kopp

9 czerwca 2020

Jak wiecie, nasze wydawnictwo zaangażowało się we wsparcie czeskiego projektu Hello Emma, a dokładniej jego polskiej wersji. Emma całkiem skutecznie w wielu zadaniach zastępuje Siri, a pod pewnymi względami nawet ją przewyższa, choć oczywiście nie ze wszystkim sobie radzi. Niestety podczas prac, razem z autorem Emmy doszliśmy do wniosku: polska Siri prędko nie powstanie, jeżeli wcale.

Dwanaście razy pięć, czyli pomnóż 12 razy (przez) 5

Wczoraj David Beck, autor Emmy napisał do mnie:

Feedback from user:

Calculator 12 x 5 (pomnóż dwanaście przez pięć).

You say first x then 12 over 5 so Calculator misunderstood x125.

Hmm, in czech we always say numer / what to do / number 12×5.

Write me some sentences for computing. Maybe will find solution if hear „przez”.

Jak widać w języku naturalnym, nadal często stosujemy notację polską, opisaną w 1920 roku przez filozofa i logika Jana Łukasiewicza. Działania w niej zapisane zaczynają się od operatora (mnożenie, dodawanie, dzielenie…), po którym następują argumenty. Dzięki czemu nie ma potrzeby stosowania nawiasów. Warto zaznaczyć, że polska notacja jest stosowana w językach Logo i Lisp. Ta notacja w „odwrotnym” zapisie, nazwana Reverse Polish Notation (RPN) była szeroko przyjęta w kalkulatorach inżynierskich i ekonomicznych marki HP i nie tylko oraz w Post Script i informatyce (stos).

Niestety w mowie potocznej poza „notacją polską” używamy również formy „dwanaście razy osiem”, co komplikuje rozpoznanie zamiarów wydającego polecenie obliczeń.

To nie koniec problemów, które napotkał David. Oto kolejny z nich:

After Emma finish one job she will ask you again „Jak moge pomoci?”

If you say „Nie” it say „Na razie” and stop. „Nie” must be in first 3 words.

In Czech we have „ne”.
But in Polish your „nie” sometimes follows by other words so „nie” is not alwasy NO.
I have to put extra words where Emma will not stop.
I know by now „nie… (przeszkadzać|wiesz)”

Any more idea?

Jest to idealna ilustracja dla starego i znanego dowcipu o referacie dotyczącym przeczeń, na konferencji lingwistycznej, którego puentę zacytuję: „Dobra, dobra”. Na pewno znacie ten dowcip.

Jeszcze tydzień temu myślałem, że większość języków słowiańskich ma podobny stopień trudności, a najwięcej problemów może powodować większa niż w innych językach liczba przypadków. Niestety jednak przygoda z Emmą i problemy, które jej autor napotkał podczas opracowywania wersji polskiej, sprowadziły mnie na ziemię. Dobrze to podsumował David:

„Well this is reason Siri will be first in Czech 🙂”

Oj chyba ma rację. Na szczęście już niebawem będziecie mogli przetestować polską Emmę! David obiecuje wersję publiczną beta jeszcze przed WWDC.

Jaromir Kopp

Użytkownik komputerów Apple od 1991 roku. Dziennikarz technologiczny, programista i deweloper HomeKit. Propagator przyjaznej i dostępnej technologii. Lubi programować w Swift i czystym C. Tworzy rozwiązania FileMaker. Prowadzi zajęcia z IT i programowania dla dzieci oraz młodzieży, szkoli też seniorów. Współautor serii książek o macOS wydanych przez ProstePoradniki.pl. Projektuje, programuje oraz samodzielnie wykonuje prototypy urządzeń Smart Home. Jeździ rowerem.
Komentarze (7)
L

7 komentarzy

  1. Pelski

    ONP używałem do wykonywania obliczeń z różnych wyrażeń gdzie liczy się kolejność wykonywania działań i w sumie duża część oprogramowania wykorzystuje właśnie ten algorytm. Nie wiem czy to będzie takim problemem zaimplementować to do Siri. Myślę, że raczej nie będzie to problemem

    • Jaromir Kopp

      Oczywiście problem nie w tym, bo nawet David za pomocą Skrótów z tym sobie poradzi.Problem jest w różnorodności form i braku konsekwencji. Np. tak głupie ale częste „pomnóż 10 przez 8” przecież „przez” się dzieli! Dodatkowo też często mówimy jak Czesi 10 razy 8.

  2. karol

    Bardzo fajny projekt. Pytanie – jak z językiem polskim radzi sobie Google? Ich asystent obsługuje Polski w dość dobrym stopniu (moim zdaniem).

    • Jaromir Kopp

      Jak ostatnio sprawdzalem to Asystent Google nie potrafił ustawić budzika, ani minutnika (systemowego). Wszystko robił w swojej apce. To niedopuszczalne dla mnie.

      • Szymon

        Jak najbardziej potrafi!

  3. QQQ

    Te skróty to jakiś horror. Kompletnie pracochłonne to i trudne do przejścia. Zrezygnowałem. Zostaje Google Asystent.

  4. Zdzisiek

    Trudno jest mi zrozumieć, czemu miałby to być problem dla Siri. Ten asystent rozumie znacznie, znacznie bardzie zawiłe zdania niż mnożenie, np przykład „open Sunshade in the Garden by 5%”, gdzie kontekst jest głębszy i wymaga zrozumienia otoczenia użytkownika.

    Poza tym po angielsku można powiedzieć dokładnie tak samo: „multiply 2 by 5” albo „2 times 5”. Zauważmy, że „by” jest również używane podczas dzielenia. Wystarczy wpisać w Google, żeby zobaczyć, że nawet wyszukiwarka to wykona.