ਵੈਕਟਰ ਸਪੇਸ ਮਾਡਲ

ਵਿਕੀਪੀਡੀਆ, ਇੱਕ ਅਜ਼ਾਦ ਗਿਆਨਕੋਸ਼ ਤੋਂ
Jump to navigation Jump to search

ਵੈਕਟਰ ਸਪੇਸ ਮਾਡਲ ਜਾਂ ਸ਼ਬਦ ਵੈਕਟਰ ਮਾਡਲ, ਵਿਸ਼ੇ ਦੇ ਡਾਕੂਮੈਂਟਾਂ (ਅਤੇ ਆਮਤੌਰ ਤੇ ਕਿਸੇ ਵੀ ਚੀਜ਼) ਨੂੰ ਪਛਾਣ ਕਰਨ ਵਾਲੇ ਵੈਕਟਰਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਪ੍ਰਸਤੁਤ ਕਰਨ ਲਈ ਇੱਕ ਅਲਜਬਰਿਕ ਮਾਡਲ ਹੁੰਦਾ ਹੈ, ਜਿਵੇਂ, ਸੂਚਕ ਸ਼ਬਦ | ਇਸਨੂੰ ਸੂਚਨਾ ਫਿਲਟਰ ਕਰਨ, ਸੂਚਨਾ ਪ੍ਰਾਪਤ ਕਰਨ, ਸੂਚਕਾਂਕਣ ਕਰਨ ਅਤੇ ਮਿਲਾਪ ਦਰਜੇ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ| ਇਸਦੀ ਵਰਤੋ ਸਭ ਤੋਂ ਪਹਿਲੀ ਵਾਰ ਸਮਾਰਟ ਇਨਫਰਮੇਸ਼ਨ ਰੀਟ੍ਰੀਵਲ ਸਿਸਟਮ ਵਿੱਚ ਕੀਤੀ ਗਈ ਸੀ

ਪਰਿਭਾਸ਼ਾਵਾਂ[ਸੋਧੋ]

ਡਾਕੂਮੈਂਟ ਅਤੇ ਸਵਾਲਾਂ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਵੈਕਟਰਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਪ੍ਰਸਤੁਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ:

ਹਰੇਕ ਅਯਾਮ ਇੱਕ ਵੱਖਰੇ ਸ਼ਬਦ ਨਾਲ ਸਬੰਧ ਰੱਖਦਾ ਹੈ| ਜੇਕਰ ਕੋਈ ਸ਼ਬਦ ਡਾਕੂਮੈਂਟ ਵਿੱਚ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਇਸਦਾ ਮੁੱਲ ਵੈਕਟਰ ਵਿੱਚ ਗੈਰ-ਜ਼ੀਰੋ ਹੁੰਦਾ ਹੈ| ਇਹਨਾਂ ਮੁੱਲਾਂ ਦਾ ਹਿਸਾਬ ਲਗਾਉਣ ਲਈ ਕਈ ਵੱਖਰੇ ਤਰੀਕੇ ਵਿਕਸਿਤ ਕੀਤੇ ਗਏ ਹਨ ਜਿਹਨਾਂ ਨੂੰ (ਸ਼ਬਦ) ਵਜ਼ਨਾਂ ਨਾਲ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ| ਸਭ ਤੋਂ ਪ੍ਰਸਿੱਧ ਤਰੀਕਾ tf-idf ਵੇਇੰਗ ਹੈ|

ਸ਼ਬਦ ਦੀ ਪਰਿਭਾਸ਼ਾ ਉਪਯੋਗ ਉੱਤੇ ਅਧਾਰਿਤ ਹੁੰਦੀ ਹੈ| ਵਿਸ਼ੇਸ਼ ਸ਼ਬਦ ਇੱਕਲੌਤੇ ਸ਼ਬਦ, ਕੁੰਜੀ ਸ਼ਬਦ, ਜਾਂ ਲੰਬੇ ਵਾਕ ਹੁੰਦੇ ਹਨ| ਜੇਕਰ ਸ਼ਬਦਾਂ ਨੂੰ ਰਕਮਾਂ ਚੁਣ ਲਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਵੈਕਟਰ ਦਾ ਅਯਾਮੀਕਰਣ ਸ਼ਬਦਾਵਲੀ ਵਿੱਚ ਸ਼ਬਦਾਂ ਦੀ ਗਿਣਤੀ ਹੁੰਦਾ ਹੈ (ਕੋਸ਼ ਵਿੱਚ ਮੌਜੂਦ ਵੱਖਰੇ ਸ਼ਬਦਾਂ ਦੀ ਗਿਣਤੀ)|

ਸਵਾਲਾਂ ਵਾਲੇ ਡਾਕੂਮੈਂਟਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਵੈਕਟਰ ਉਪਰੇਸ਼ਨਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ|