Az e-kereskedelmi áttekintések hatékony hosszú távú, rövid távú memórián alapuló hangulatelemzése 2. rész
Jan 18, 2024
Muhammad et al. [20] bemutatott egy modellt a szentimentanalízishez a word2vec és az LSTM használatával a szállodaértékelésekhez.
Mohamed próféta és az iszlám alapítója. Bölcsnek, bölcsnek és bölcs embernek ismerik. Memóriája nagyon erős, aminek köszönhetően nagyon hatékonyan tudja feldolgozni az információkat és kifejezni gondolatait.
Mohamed emlékezete nagyban összefügg műveltségével és tapasztalatával. A feljegyzések szerint fiatal korában gyakran elmerült a gondolkodásban és az elmélkedésben. Ez a kíváncsiság és tudásszomj segített neki erős tudásbázist és memóriaképességet kialakítani.
Emellett Mohamed intelligenciája is nagy szerepet játszott memóriaképességében. Okos, szellemes, éleslátó, logikus gondolkodási képességgel rendelkezik, ami nagyon előnyös összetett információk kezelésekor. Ez az előny segített neki jobban kezelni és kontrollálni a memóriafolyamatot, ezáltal javítva a memóriáját.
Mohamed memóriája azonban nem veleszületett, hanem kemény munka és gyakorlás révén fejlődött. Gyakran végez memóriatréninget, például ismételt olvasást, diktálást és beszédet, hogy segítse az ismeretek mélyebb megértését és elsajátítását.
Mohamed emlékezete nemcsak természetes tehetség volt, hanem kemény munkával és gyakorlással fejlődött. Ez azt mutatja, hogy tanulással és gyakorlással mindannyian javíthatjuk memóriánkat, valamint javíthatjuk tanulási és munkavégzési hatékonyságunkat. Mohamedhez hasonlóan aktívan dolgozzunk azon, hogy folyamatosan fejlesszük memóriakészségeinket, hogy nagyobb sikereket érjünk el az életben és a munkában! Látható, hogy javítanunk kell a memórián, a Cistanche deserticola pedig jelentősen javíthatja a memóriát, mert a Cistanche deserticola szabályozhatja a neurotranszmitterek egyensúlyát is, például növelheti az acetilkolin és a növekedési faktorok szintjét. Ezek az anyagok nagyon fontosak a memória és a tanulás szempontjából. Ezen túlmenően a hús javíthatja a véráramlást és elősegítheti az oxigénszállítást, ami biztosítja, hogy az agy elegendő tápanyagot és energiát kapjon, ezáltal javítva az agy vitalitását és állóképességét.

Kattintson a Tudás gombra a rövid távú memória javításához
Ehhez a tanulmányhoz az adatokat az utazási webhely szelén és törmelék felhasználásával történő feltérképezésével gyűjtötték össze. +e A kísérlet fő célja a pontosság elemzése volt a word2vec és az LSTM paramétereinek megváltoztatásával. +e eredmények azt mutatták, hogy a paraméterek használatával 85,96-os átlagos pontosság érhető el, ami ígéretes eredményeket mutatott.
Zhao et al. [21] bevezetett egy új technikát az ügyfelek e-kereskedelmi webhelyeken írt vélemények elemzésére. +A javasolt optimalizált technika "a LocalSearch Improvised Bat Algorithm alapú Elman NeuralNetwork (LSIBA-ENN)" négy lépésből áll, és észleli a polaritást és osztályozza a vélemények véleményét. A kutatáshoz +e adatokat az e-kereskedelmi webhelyeken található web scrappingtool segítségével gyűjtöttük össze a vásárlói vélemények kinyerésére.
Az adatok előfeldolgozása mellett ez a tanulmány a "LogTerm Frequency-based Modified Inverse Class Frequency (LTF-MICF) és a hibrid mutáció alapú földmeleg algoritmus (HMEWA)" módszert használja a kifejezések súlyozására és a jellemzők kiválasztására. +e javasolt módszertan túlszárnyalta a többi kiindulási technikát az előrejelzési pontosság tekintetében.
Jiang [22] modellt javasolt a Taobao e-kereskedelmi platformról kapott vélemények osztályozására.+e tanulmány gépi tanulási algoritmust, valamint vektoros gépet használ az osztályozáshoz, és javítja a részecskerajok optimalizálását (IPSO) a paraméterek optimalizálásához. +A tanulmányhoz szükséges adatokat a weboldal megjegyzéseinek feltérképezésével gyűjtöttük össze. +e kísérleti eredmények azt mutatták, hogy az SVM és az IPSO kombinált megközelítése nagyobb pontossággal rendelkezik. A létező modellek többsége azonban túlillesztéstől [23–25], gyenge konvergenciasebességtől [26–28] és eltűnő gradiens-problémáktól [29–31] szenved.
3. Kísérleti tanulmány
Az +is szakasz világos áttekintést ad a projektben a hangulatok osztályozására használt módszertanról. Az alkalmazott technika egy Long Short-Term Memory hálózat, amelyet nagyszámú Amazonadatbázis-értékelés osztályozására használnak. A használt beágyazás a word2vec, amely az adatbázis szerint lett egyedileg betanítva.
A word2vec adatkészlet szerinti hangolása javítja a modell általános teljesítményét. +Az LSTM használatának az az előnye, hogy még a strukturálatlan áttekintési adatoknál is jobb eredményeket ad. Hasznos funkciókat képes elérni a hosszú távú függőséget tartalmazó erőforrások számára.
Az adatokat az Amazon áttekintési adatkészletéből gyűjtjük össze, amelyet aztán előfeldolgozunk. A Word2vec beágyazások fontos lépést jelentenek az adatok előfeldolgozásában. A vonat- és tesztadatok létrejöttek. +e képzési adatok képzési és érvényesítési adatkészletekre vannak felosztva. +Az egyéni word2vec modell adatbázisonként van kiképezve. +e jellemzővektort kapunk, amelyet azután az LSTM modell beágyazási rétegeként használunk.
A Keras az LSTM szekvenciális modell felépítésére szolgál, amelynek maximális jellemzői 50,000 és 16 beágyazási méret. A +e modellt a sklearn teljesítménymérők alapján tesztelték. +A funkciók megszerzésének folyamatát a 2. ábra mutatja be.
3.1. Adatkészlet. A pontos eredmények eléréséhez a használt adatkészletnek nagynak és gazdagnak kell lennie. A +e adatkészletet az Amazon Reviews adatkészlet (2018) mobiltelefonok és tartozékok online részéből gyűjtöttük össze. +e adatkészlet összesen 938 261 véleményből áll, amelyek közül 47901 egyedi termékről és 153124 egyedi felhasználói véleményről szól. Az +e adatkészlet kezdetben 7 oszlopból áll, nevezetesen egy értékelésből, amely 1-től 5-ig változik, a felülvizsgálati időből, az értékelő azonosítójából, a termékazonosítóból és a felülvizsgálati szöveg összefoglalójából.
Az ismétlődések eldobása után az adatkészlet 938254 rekordból áll, és a 2. táblázat az eredeti adatkészletrekordok részletét mutatja.
3.2. Módszertan. A word2vecmodellünket testre szabtuk, hogy az LSTM modellel együtt használható legyen az osztályozáshoz. A Word2vec egy szóbeágyazás, amely egy szónak egy vektor több kifejezésének gyűjteményével történő megjelenítésére szolgál. Ez távol áll attól, hogy egy szót vektortérbe leképezzünk. +e adatkészlet egy panda adatkeretbe van betöltve. Egy customword2vec modell kidolgozásához az első lépés az adatok előfeldolgozása.
Csak nézzük meg az értékelést és az értékelés szövegét, és dobjunk el mindent. +e szöveg törlődik az írásjelek eltávolításával. A szöveg Asub-mintája közel 200,000 véleményből készül, és a tiszta szöveg módszert alkalmazzák, hogy minden értékelést szólistává alakítsanak. A szavak listája most a genizmus word2vec modell bemeneteként működik.
Felépítettünk egy testre szabott skip-gram word2vecmodellt, és példányosítottuk a modellt méretekkel: a szóvektorok mérete 100, az ablak mérete 15, a min_countas 2 a korpuszunkban 2-nél kevesebbszer megjelenő szavaknál, negatív egyenlő 5, és mintavételi frekvencia egyenlő 1e−5. Mindezeket a dimenziókat felhasználtuk egy szókincs felépítésére áttekintő mondatainkból.

Word2vec modellünket 1000 korszakra tanítjuk. +hu minden korszakban kiszámoljuk a veszteséget. +e veszteség nagy az elején, és az utolsó korszak felé csökken. +e veszteség atepoch 0 értéke 2239394.0 és a veszteség az 1000. epochánál 11504.0.+A mentett modell ezután újra betöltődik, és műveleteket hajtanak végre rajta.
Például, ha a zajhoz hasonló szavakat akarunk találni az adatkészletünkben, kapunk törlést és fejhallgatót.
Hasonlóképpen megtalálhatjuk a hasonlóságot bizonyos szavak között, mint például a fülhallgató és a fejhallgató, ami {{0}}.48756, a töltés és a töltő szavak közötti hasonlóság pedig 0,89264.
Adataink méretének csökkentése érdekében TSNE vizualizációt használtunk, hogy az adatokat két dimenzióban ábrázoljuk. Most ezek a szóvektorok további osztályozásra használhatók. Az +ese beágyazások ezután szolgáltatásként használhatók a további adatfolyamokhoz.
3.2.1. Adatok előkészítése LSTM-hez. Adatkészletünk 938254 rekordból áll, és a legtöbb értékelés pontszámeloszlása 3-nál nagyobb. Először is kiszámítottuk az egyes vélemények szószámát. Az +e átlagos átlag statisztikaként használható a vélemények átlagos hosszának meghatározásához. +e a recenzió átlaghossza 44,59, a maximális hossza pedig 4303.
Létrehoztunk egy adatkészletet, amely legfeljebb 100 szót tartalmazó véleményekből áll. Azok a vélemények, amelyek hossza meghaladja a 20-at, de kevesebb, mint 100, a rövid áttekintések, az újranézések pedig a hosszú vélemények közé tartoznak. +e a rövid áttekintések száma 411313, a hosszú vélemények száma pedig 100239. A modellben használt hiperparaméterek leírását a 3. táblázat tartalmazza.
Ezután pozitívnak határoztuk meg a hangulatértékelést, ha az értékelés nagyobb vagy egyenlő, mint 3; ellenkező esetben az értékelés negatív. Figyelembe vettük a felülvizsgálati szöveget és a véleményt a vonatadatkészlet létrehozásához. +e tesztadatok legalább 10-nél több értékelést tartalmazó termékekből állnak.
Az elosztás után a képzési adatkészlet összesen 203891 rekordot tartalmazott, amelyek közül 175910 a pozitív osztályba, 27981 pedig a negatív osztályba tartozott. +e tesztadatállomány összesen 686345 rekordot tartalmazott, amelyek közül 592118 a pozitív, 94227 pedig a negatív osztályba tartozott.
Ebben a tanulmányban a Keras segítségével készítettük el LSTM-modellünket, amely legfeljebb 50,000 funkciót használ a beágyazási réteg bemeneteként. A hosszú távú rövid távú memória (LSTM) egyfajta visszatérő neurális hálózat, amely belső mechanizmust használ, amely szabályozza az információáramlást. A belső mechanizmus olyan kapukból áll, amelyeket meg kell tanítani, hogy pontosan kiszűrjék a nem releváns információkat és megőrizzék a hasznos információkat.

A 3. ábra az LSTM-modell alapvető architektúráját mutatja a javasolt módszertanban.
A Ht−1 és Xt az LSTM egység bemenetei; a Ht−1, amelyet rövid távú memóriának neveznek, az előző állapotok kimenetét veszi be bemenetként. +e memóriacella vagy a hosszú távú memória, Ct −1, segít a releváns információk átvitelében a sorozat folyamata során. Az +eLSTM architektúra három kaput egyesít: felejtőkapu, bemeneti kapu és kimeneti kapu. Az LSTM egységben tanh és sigmoid funkciókat használnak ezeknek a kapuknak a megszerzésére.
A +e vonatadatokat ezután egyenlő hosszúságú vonat- és érvényesítési adatokra osztottuk. Az adatok +e hosszát 101945-re számoltuk, az osztályeloszlás pedig {1: 87955, 0:13990} volt. A TensorFlow vonatteszt és érvényesítési adatkészletek létrehozásához szekvenciákká kell konvertálnunk a vonatadatokat. Maximum 100 hosszúságúra párnáztuk őket, hogy minden sorozat azonos hosszúságú legyen. +e vonat- és tesztcímkék

For more information:1950477648nn@gmail.com






