Archiwa tagu: dual quality

Wykrywanie podwójnej jakości w recenzjach produktów

Czy zdarzyło Ci się kupić „ten sam” produkt w dwóch krajach i poczuć, że to jednak nie to samo? Ten odcinek poświęcony jest zjawisku podwójnej jakości (dual quality) na rynkach UE oraz temu, jak modele NLP mogą pomagać wykrywać takie rozbieżności na podstawie opinii konsumentów.

O czym jest rozmowa?

Aleksandra „Alex” Biel i dr Julian Hart omawiają kontekst konsumencki i regulacyjny, a następnie przechodzą do strony badawczej: jak buduje się zbiory danych z recenzji, jak wygląda anotacja oraz jak modele językowe „czytają” niuanse, które mogą wskazywać na różnice w składzie lub jakości między rynkami.

W tym odcinku usłyszysz m.in.:

  • co dokładnie oznacza „podwójna jakość” i kiedy może wprowadzać konsumentów w błąd,
  • jak UE podchodzi do tego problemu od strony ochrony konsumentów,
  • jak badacze zbudowali i oznaczyli zestaw ok. 2 tysięcy recenzji, w tym takich związanych z dual quality,
  • dlaczego w praktyce model lokalny (np. dostrojony do języka polskiego) bywa lepszy od modeli wielojęzycznych,
  • jakie błędy najczęściej popełniają modele (m.in. mylenie dual quality z podróbkami lub „zwykłą” reklamacją jakości),
  • dokąd to zmierza: większe, wielojęzyczne dane i łączenie modeli lokalnych z globalnymi.

Artykuł źródłowy

Rafał Poświata, Marcin Michał Mirończuk, Sławomir Dadas, Małgorzata Grębowiec, Michał Perełkiewicz: Unveiling Dual Quality in Product Reviews: An NLP-Based Approach (arXiv). Przejdź do publikacji na arXiv


Posłuchaj odcinka

Odcinek na Jellypod

Odcinek na Spotify

Unveiling Dual Quality in Product Reviews: An NLP-Based Approach

Consumers often face inconsistent product quality, particularly when identical products vary between markets, a situation known as the dual quality problem. To identify and address this issue, automated techniques are needed. This paper explores how natural language processing (NLP) can aid in detecting such discrepancies and presents the full process of developing a solution. First, we describe in detail the creation of a new Polish-language dataset with 1,957 reviews, 540 highlighting dual quality issues. We then discuss experiments with various approaches like SetFit with sentence-transformers, transformer-based encoders, and LLMs, including error analysis and robustness verification. Additionally, we evaluate multilingual transfer using a subset of opinions in English, French, and German. The paper concludes with insights on deployment and practical applications.

Czytelnik może znaleźć więcej informacji w wersji angielskiej wpisu lub bezpośrednio w artykule.