Bielik v2 wylądował. Polski model językowy AI otwarty dla wszystkich
Organizacja SpeakLeash.org ogłosiła dzisiaj, że ich najnowszy model polskiego chatbota opartego o sztuczną inteligencję, Bielik v2, jest teraz dostępny dla wszystkich. Ta długo oczekiwana premiera stanowi istotny krok w rozwoju sztucznej inteligencji w Polsce, oferując użytkownikom zaawansowane możliwości interakcji w języku polskim. Bielik v2, będący owocem współpracy Fundacji SpeakLeash i Academic Computer Centre CYFRONET AGH, wyróżnia się nie tylko imponującą liczbą 11 miliardów parametrów, ale także szerokim oknem kontekstowym, które umożliwia przetwarzanie dłuższych i bardziej złożonych tekstów. Dzięki temu modelowi, polska społeczność zyskuje narzędzie, które może znacząco wpłynąć na rozwój lokalnych aplikacji AI, przyczyniając się do decentralizacji technologii i zwiększenia jej dostępności dla wszystkich.
Spis treści
Kluczowe cechy Bielika v2
Warto zacząć od tego, że Bielik, jak nazwa może sugerować, jest w pełni polskim produktem (o czym za chwilę). Bielik v2 to nowoczesny model sztucznej inteligencji, który wprowadza szereg innowacji, mających na celu poprawę jakości interakcji w języku polskim. Poniżej przedstawiamy kluczowe cechy, które wyróżniają ten model na tle innych:
- Zwiększony rozmiar: Model dysponuje 11 miliardami parametrów, co znacząco poprawia jego zdolność do rozumienia i generowania tekstu w języku polskim. Większa liczba parametrów pozwala na bardziej złożone analizy językowe oraz lepsze uchwycenie kontekstu.
- Szerokie okno kontekstowe: Bielik v2 obsługuje kontekst do 32 768 tokenów, co umożliwia przetwarzanie dłuższych tekstów i bardziej skomplikowanych zadań. Taka funkcjonalność jest szczególnie przydatna w aplikacjach wymagających analizy większych fragmentów tekstu, jak np. podsumowywanie artykułów czy analiza dokumentów.
- Ulepszona baza treningowa: Model został wytrenowany na znacznie większej ilości wysokiej jakości danych, co przekłada się na lepsze wyniki w różnorodnych zadaniach językowych. Wysoka jakość danych treningowych jest kluczowa dla osiągnięcia dokładności i precyzji w generowanych odpowiedziach.
- Poprawione NLP: Bielik v2 osiąga lepsze wyniki w zadaniach związanych z przetwarzaniem języka naturalnego (NLP), takich jak podsumowywanie tekstów, rozpoznawanie jednostek nazewniczych (NER) oraz generowanie odpowiedzi na pytania. Ulepszenia te sprawiają, że model jest bardziej wszechstronny i efektywny w różnych zastosowaniach.
- Elastyczność wdrożenia: Model dostępny jest w wersjach skwantyzowanych, co umożliwia jego efektywne wykorzystanie na różnych platformach sprzętowych. Dzięki temu użytkownicy mogą dostosować model do swoich potrzeb, niezależnie od dostępnych zasobów obliczeniowych.
- Wysoka jakość generowanych odpowiedzi: Pomimo relatywnie niewielkich rozmiarów, Bielik v2 dorównuje jakością większym modelom, co potwierdzają wyniki benchmarków, takich jak Open LLM PL Leaderboard. Model wykazuje konkurencyjność w stosunku do znacznie większych systemów, co czyni go atrakcyjną opcją dla lokalnych zastosowań.
Co wyróżnia Bielika v2 według samego chatbota?
Zadałem Bielikowi v2 pytanie o to, co go wyróżnia na tle innych chatbotów AI, a jego odpowiedź ujawnia kilka kluczowych cech, które samodzielnie podkreśla. Co mi odpowiedział:
- Przyjazność i uprzejmość: Bielik stara się prowadzić rozmowy w sposób przyjazny, unikając tematów nieodpowiednich lub obraźliwych, co ma na celu stworzenie komfortowej atmosfery dla użytkownika.
- Szeroka wiedza: Model dysponuje rozległą wiedzą z różnych dziedzin, od matematyki i programowania po kreatywne pisanie, co czyni go wszechstronnym narzędziem do interakcji.
- Uczciwość: Bielik informuje użytkowników, gdy nie zna odpowiedzi na pytanie lub gdy informacja może być niepewna, co pokazuje jego transparentność.
- Dostosowanie do języka użytkownika: Model odpowiada w języku, którego używa użytkownik, co ułatwia komunikację.
- Dokładność i szczegółowość: W przypadku bardziej złożonych pytań, Bielik dostarcza dokładne i szczegółowe odpowiedzi, a dla prostszych pytań udziela zwięzłych informacji.
- Bezpieczeństwo: Priorytetem dla Bielika jest bezpieczeństwo użytkowników, dlatego dopytuje lub informuje o swoich wątpliwościach.
- Użycie Markdowna i Latexa: Model wykorzystuje Markdown do formatowania tekstu oraz Latexa do przedstawiania wzorów matematycznych, co zwiększa przejrzystość odpowiedzi.
- Ograniczenia: Bielik jest świadomy swoich ograniczeń i nie potrafi uczyć się na bieżąco, ale stara się być jak najbardziej pomocny w ramach swoich możliwości.
Zaznaczmy to jeszcze raz. Powyższe cechy Bielik wymienia samodzielnie, Mogą one budować pozytywny obraz jego funkcjonalności. Niemniej jednak, rzeczywistość może być inna, a użytkownicy powinni sami przekonać się, jak model sprawdza się w praktyce. Jakie są rzeczywiste doświadczenia z interakcji z Bielikiem? To pytanie pozostaje otwarte i zachęca do osobistego testowania jego możliwości.
Uruchamianie Bielika v2 lokalnie lub online
Bielik v2 oferuje użytkownikom elastyczność w dostępie do swojego modelu AI, umożliwiając uruchomienie go zarówno lokalnie, jak i online. Dla tych, którzy dysponują odpowiednim sprzętem, istnieje możliwość skorzystania z narzędzia Ollama, które pozwala na uruchomienie modelu na własnym komputerze. Wystarczy wpisać polecenie:
ollama run SpeakLeash/bielik-11b-v2.2-instruct:Q8_0
Źródło: LinkedIn Piotra Cieluchowskiego,
To polecenie uruchamia Bielika v2, co daje użytkownikowi możliwość testowania jego funkcji w komfortowych warunkach lokalnych. Wymaga to jednak posiadania komputera o wystarczających parametrach, aby model mógł działać płynnie i efektywnie.
Dla tych, którzy nie mają mocnego sprzętu lub preferują szybszy dostęp do modelu, dostępna jest również opcja korzystania z platformy online. Można to zrobić, odwiedzając stronę chat.bielik.ai. Ta opcja pozwala na natychmiastowe testowanie możliwości Bielika v2 bez konieczności instalacji dodatkowego oprogramowania. Użytkownicy mogą w prosty sposób rozpocząć interakcję z chatbotem, co czyni go dostępnym dla szerszego grona odbiorców, niezależnie od ich zasobów sprzętowych.
Kim Są Twórcy Bielika - Fundacja SpeakLeash i ACK Cyfronet AGH
Premiera modelu Bielik v2, najnowszego chatbota opartego na sztucznej inteligencji, to owoc współpracy Fundacji SpeakLeash i Academic Computer Centre CYFRONET AGH. Organizacje te połączyły siły, aby stworzyć zaawansowane narzędzie do interakcji w języku polskim.
Fundacja SpeakLeash (nazywana również Spichlerz) którą to projekt open-source, który skupia się na rozwoju polskiej sztucznej inteligencji. Zespół fundacji dokonał starannego wyboru i obróbki polskich korpusów tekstowych, które posłużyły do wytrenowania modelu.
Z kolei ACK Cyfronet AGH to ośrodek obliczeniowy wysokiej wydajności, który udostępnił infrastrukturę do skalowanego przetwarzania w języku polskim. Wsparcie grantu obliczeniowego nr PLG/2024/016951 umożliwiło wykorzystanie najnowocześniejszych technologii i zasobów obliczeniowych na superkomputerach Athena i Helios.
Dzięki tej unikatowej współpracy, model Bielik v2 wyróżnia się wyjątkową zdolnością do rozumienia i przetwarzania języka polskiego. Generuje on dokładne odpowiedzi i wykonuje różnorodne zadania językowe z wysoką precyzją.
Premiera Bielika v2 to ważny krok w rozwoju polskiej sztucznej inteligencji. Fundacja SpeakLeash i ACK Cyfronet AGH udowadniają, że wspólnymi siłami można tworzyć zaawansowane modele AI dostosowane do lokalnych potrzeb.
CHAT ARENA PL - Platforma do testowania i rozwoju polskich modeli językowych
CHAT ARENA PL to unikalna platforma stworzona przez Fundację SpeakLeash, której celem jest rozwój kompetencji sztucznej inteligencji w języku polskim. Jest to swoiste „pole bitwy”, na którym użytkownicy mogą porównywać umiejętności różnych modeli językowych w odpowiadaniu na zadane pytania lub prompty
Jak działa CHAT ARENA PL?
Platforma składa się z kilku kluczowych elementów:
- Wpisywanie promptów: Użytkownicy zaczynają od wpisania pytania lub zadania dla modelu AI
- Generowanie odpowiedzi: System tworzy odpowiedzi z dwóch modeli językowych na podstawie podanego promptu
- Ocena odpowiedzi: Użytkownicy oceniają, która odpowiedź jest lepsza. Po dokonaniu oceny system ujawnia użyte modele
- Zapis promptów: Wszystkie wprowadzone prompty są zapisywane w celach analitycznych i poprawy jakości przyszłych modeli
Takie podejście nie tylko angażuje użytkowników, ale także umożliwia im bezpośrednie porównanie jakości odpowiedzi. Wiele osób może być zaskoczonych, jak wysoką jakość potrafi udzielić Bielik, co czyni tę platformę wartościowym narzędziem do nauki i eksploracji sztucznej inteligencji w języku polskim.
Funkcje CHAT ARENY PL
- Zakładka „Bitwa!”: Właściwa arena modeli językowych, gdzie użytkownicy podają prompt, a modele generują odpowiedzi
- Zakładka „Zadania”: Przykładowe prompty, które mogą służyć jako inspiracja dla użytkowników
- Zakładka „Tablica liderów”: Ranking ELO modeli biorących udział w konfrontacji
- Zakładka „Bielik vs świat”: Możliwość porównania jakości generowanych tekstów przez model Bielik.AI z innymi modelami z całego świata
Poniżej umieszczam zrzut ekranu z areny. Prompt z dostępnych propozycji brzmi (pisownia oryginalna):
"Gdybys mial psa ile razy wpprowadzalbys go na spacer"
Arena wygenerowała poniższe dwie odpowiedzi. Sami zastanówcie się która z poniższych odpowiedzi jest lepsza. Pod obrazkiem jest informacja, którą odpowiedź wygenerował Bielik.
Kliknij, by zobaczyć jakie modele wygenerowały odpowiedzi
Odpowiedź A wygenerował model gpt-4o-mini
Odpowiedź B wygenerował Bielik-2.1-11B
Cel CHAT ARENY PL
Głównym celem platformy jest rozwój kompetencji sztucznej inteligencji w języku polskim. Wszystkie wprowadzone prompty są wykorzystywane do analizy i poprawy jakości przyszłych modeli językowych. Platforma służy również do pozycjonowania modeli względem siebie w rankingu ELO, co pozwala w miarodajny sposób zestawić ich umiejętności w zadaniach w języku polskim