Kääntäminen

Tekstianalyysi

Luokittelu

Annotointi

Tietämyskannat

Neuroverkkojen valmennusdata

Sentimenttianalyysi
Aihemallinnus

 

Taloustutkimus

Sijoittaminen

Julkaisuala

Energiatieto

 

 

  Teemapoint

  Teemapoint

Kieliteknologiaan ja semanttisiin verkkoihin liittyviä sovelluksia.

Tällä sivustolla esitetyt kieliteknologiaa hyödyntävät käyttökohteet ovat pääosin tulosta englannin kielen jäsentimen ja sitä käyttävien sovellusten kehitystyöstä. Käyttökohteista pisimmällä ja tuotteistettuna on englanti-suomi konekääntäminen.

Semanttisissa verkoissa tietoa on organisoitu Internet-verkossa tavalla, että toisiinsa liittyvää tietoa on helpompi hakea ja yhdistellä. Tässä esiteltyjä menetelmiä voidaan käyttää luomaan semanttisen verkon tietokantoja tekstitiedoista.
[> ...]

  Demot

  Demot

Tekstiä kääntäviin online englanti-suomi käännösohjelmiin teemapoint.fi:n Translator, sekä
teemapoint.com:in ParserServlet (TR-painike)
tarvitaan tunnuskoodi, jonka saa yhteystietosivun lomakkeella. Ohjelmat kääntävät 3000 merkkiä kerralla.

Verkkosivujen käännökset ovat englanninkielisen sivun vasemmassa laidassa, sekä sen toiminnon alapuolella on valmiina BBC:n uutisotsikoiden ja -artikkeleiden käännökset.

ParserServlet on englannin kielen syntaktinen jäsennin. Jäsennyksen (Parse) ja käännösten lisäksi siinä on myös muitakin toimintoja:
WN-painike tulostaa englanninkielisestä tekstistä sanojen perusmuodot sekä linkit WordNet-aineistoon.
WSD disambiguoi WordNetin sanamerkityksiä, eli pyrkii valitsemaan oikean merkitystietueen WordNet-sanastosta käsiteltävänä olevan tekstin sanoille.
Options-sivulta saadaan käyttöön taivutusohjelma suomen kielen sanoille (lisäohje).

Semanttisista verkoista on esimerkkinä RDF-tietokanta (eBooks Context Browser Demo), johon on poimittu aiheita elektronisista kirjoista käyttäen luonnollisen kielen prosessointitekniikoita.

[> ...]

 

  Muita käyttökohteita
  • Uutisartikkeleiden vertailua pörssikurssien kehityksiin. Joitain hahmotelmia ja tuloksia artikkeleissa esiintyvien kaavojen ja osakkeiden korrelointiin.
  • Uutisseurannasta dataa sijoittamisen tueksi, Päiväkauppa osakkeilla ja osakkeiden hinnanerosopimuksilla (CFD).   Useita strategioita, esimerkiksi uutisvertailun yhdistäminen back-testaukseen ja samalla vinkkejä seurattavista tiedoista. Parametrejä ja signaaleja algoritmiseen kaupankäyntiin.
  • Yhtymäkohtia koneoppimiseen ja neuroverkkoihin kuten tekstien luokittelussa taikka ennustemallien laatimisessa, mistä esimerkki osakekurssien päivänsisäisten liikkeiden ennakoinnista.
  Semanttisen verkon testisovelluksia

  Tuotteet/Palvelut

  Tuotteet/Palvelut

Java-komponenttien lisensointi ja integrointi asiakassovelluksiin.

Englanti-suomi käännösohjelman työasemaversio.
Latauslinkin saa yhteystiedoista.

Muita tuotteita sopimuksen mukaan:
Suomen kielen sanojen taivutusohjelma (Java API). Kantasanojen johtaminen taivutusmuodoista (morfologinen analysaattori).

Englanninkieliseen WordNet-sanastoon on linkitetty suomenkielisiä käännösvastineita. Tuloksena olevaa suomennettua WordNetiä on mahdollista käyttää kuten alkuperäistä aineistoa.

Demo-osioissa esitettyjä sovelluksia voidaan liittää työasemaversioon tai toimittaa erikseen.

Esimerkkiohjelmat ovat olleet toiminnassa useilla erilaisilla alustoilla kuten web-hotelleissa, virtuaalipalvelimissa, dedikoiduilla Windows- ja Linux-palvelimilla sekä mm. Heroku ja OpenShift -pilvipalveluissa.
Työssä on käytetty monia Java-sovelluskehitystä tukevia työkaluja ja tietokantaratkaisuja.
[> ...]

 

 

Syntaktisten ja semanttisten kaavojen poiminta tekstiaineistoista

Poimittujen esimerkkien käännökset

Frekvenssitilastot

Kontekstiin perustuvat haut yhdessä Lucene ja Solr -hakutyökalujen kanssa

 

Tukea tutkimusaiheisiin: syntaksi, semantiikka, ontologiat, graafitietokanta (symbolinen AI) -- toteutustavat ja tulokset verrattuna suurten kielimallien (Large Language Models, LLM) tilastoihin ja laskentaan pohjautuviin sovelluksiin, taikka näiden yhdistelmä (neurosymbolinen AI)