ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ (ਉਦਾਹਰਣਾਂ ਦੇ ਨਾਲ) ਲਈ ਰੇਜੈਕਸ ਫਿਲਟਰਾਂ ਨੂੰ ਕਿਵੇਂ ਲਿਖਣਾ ਅਤੇ ਟੈਸਟ ਕਰਨਾ ਹੈ
ਜਿਵੇਂ ਕਿ ਮੇਰੇ ਬਹੁਤ ਸਾਰੇ ਲੇਖ ਇੱਥੇ ਹਨ, ਮੈਂ ਇੱਕ ਕਲਾਇੰਟ ਲਈ ਕੁਝ ਖੋਜ ਕਰਦਾ ਹਾਂ ਅਤੇ ਫਿਰ ਇਸਦੇ ਬਾਰੇ ਇੱਥੇ ਲਿਖਦਾ ਹਾਂ. ਇਮਾਨਦਾਰ ਹੋਣ ਲਈ, ਇਸਦੇ ਕਈ ਕਾਰਨ ਹਨ ... ਪਹਿਲਾਂ ਇਹ ਹੈ ਕਿ ਮੇਰੀ ਭਿਆਨਕ ਯਾਦ ਹੈ ਅਤੇ ਜਾਣਕਾਰੀ ਲਈ ਅਕਸਰ ਆਪਣੀ ਖੁਦ ਦੀ ਵੈਬਸਾਈਟ ਤੇ ਖੋਜ ਕਰਦੇ ਹਾਂ. ਦੂਜਾ ਦੂਜਿਆਂ ਦੀ ਮਦਦ ਕਰਨਾ ਹੈ ਜੋ ਜਾਣਕਾਰੀ ਦੀ ਭਾਲ ਵੀ ਕਰ ਸਕਦੇ ਹਨ.
ਨਿਯਮਤ ਸਮੀਕਰਨ (ਰੀਜੈਕਸ) ਕੀ ਹੁੰਦਾ ਹੈ?
ਰੇਜੈਕਸ ਇੱਕ ਡਿਵੈਲਪਮੈਂਟ ਵਿਧੀ ਹੈ ਜੋ ਟੈਕਸਟ ਦੇ ਮੇਲ ਜਾਂ ਬਦਲਣ ਲਈ ਟੈਕਸਟ ਦੇ ਅੰਦਰ ਅੱਖਰਾਂ ਦੇ ਪੈਟਰਨ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ਪਛਾਣ ਕਰਨ ਲਈ ਹੈ. ਸਾਰੀਆਂ ਆਧੁਨਿਕ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਿਯਮਤ ਸਮੀਕਰਨ ਦਾ ਸਮਰਥਨ ਕਰਦੀਆਂ ਹਨ.
ਮੈਨੂੰ ਨਿਯਮਿਤ ਸਮੀਕਰਨ ਪਸੰਦ ਹਨ (regex) ਪਰ ਸਿੱਖਣ ਅਤੇ ਟੈਸਟ ਕਰਨ ਲਈ ਉਹ ਥੋੜੇ ਜਿਹੇ ਨਿਰਾਸ਼ਾਜਨਕ ਜਾਂ ਗੁੱਸੇ ਭਰੇ ਹੋ ਸਕਦੇ ਹਨ. ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀਆਂ ਕੁਝ ਅਸਚਰਜ ਸਮਰੱਥਾਵਾਂ ਹਨ ... ਜਿੱਥੇ ਤੁਸੀਂ ਨਿਯਮਤ ਸਮੀਕਰਨ ਨਾਲ ਵਿਚਾਰਾਂ ਨੂੰ ਬਣਾ ਸਕਦੇ ਹੋ ਜਾਂ ਨਿਯਮਤ ਸਮੀਕਰਨ ਦੇ ਅੰਦਰ ਆਪਣੇ ਡੇਟਾ ਨੂੰ ਫਿਲਟਰ ਕਰ ਸਕਦੇ ਹੋ.
ਉਦਾਹਰਣ ਦੇ ਲਈ, ਜੇ ਮੈਂ ਆਪਣੇ ਟੈਗ ਪੇਜਾਂ ਤੇ ਸਿਰਫ ਟ੍ਰੈਫਿਕ ਵੇਖਣਾ ਚਾਹੁੰਦਾ ਹਾਂ, ਤਾਂ ਮੈਂ ਇਸਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਪਰਮੇਲਿੰਕ structureਾਂਚੇ ਵਿੱਚ / ਟੈਗ / ਫਿਲਟਰ ਕਰ ਸਕਦਾ ਹਾਂ:
/tag\/
ਸੰਟੈਕਸ ਉਥੇ ਮਹੱਤਵਪੂਰਨ ਹੈ. ਜੇ ਮੈਂ ਹੁਣੇ ਹੀ "ਟੈਗ" ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ, ਤਾਂ ਮੈਂ ਉਨ੍ਹਾਂ ਵਿੱਚ ਸ਼ਬਦ ਟੈਗ ਦੇ ਨਾਲ ਸਾਰੇ ਪੰਨੇ ਪ੍ਰਾਪਤ ਕਰਾਂਗਾ. ਜੇ ਮੈਂ “/ ਟੈਗ” ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ ਤਾਂ ਕੋਈ ਵੀ URL ਜੋ ਟੈਗ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਏਗਾ, ਜਿਵੇਂ / ਟੈਗ-ਪ੍ਰਬੰਧਨ ਕਿਉਂਕਿ ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ ਨਿਯਮਤ ਸਮੀਕਰਨ ਤੋਂ ਬਾਅਦ ਕਿਸੇ ਵੀ ਪਾਤਰ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਡਿਫਾਲਟ ਹੁੰਦਾ ਹੈ. ਇਸ ਲਈ, ਮੈਨੂੰ ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ ਕਿ ਮੇਰੇ ਕੋਲ ਹੇਠ ਲਿਖੀ ਸਲੈਸ਼ ਸ਼ਾਮਲ ਹੈ ... ਪਰ ਇਸ 'ਤੇ ਇਸਦਾ ਬਚਣ ਦਾ ਪਾਤਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ.
ਰੀਜੈਕਸ ਸਿੰਟੈਕਸ ਬੇਸਿਕਸ
ਸੰਟੈਕਸ | ਵੇਰਵਾ |
^ | ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ |
$ | ਨਾਲ ਖਤਮ ਹੁੰਦਾ ਹੈ |
. | ਕਿਸੇ ਵੀ ਕਿਰਦਾਰ ਲਈ ਵਾਈਲਡਕਾਰਡ |
* | ਜ਼ੀਰੋ ਜਾਂ ਪਿਛਲੀ ਵਸਤੂ ਦਾ ਹੋਰ |
.* | ਵਿੱਚ ਕਿਸੇ ਵੀ ਪਾਤਰ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ |
? | ਜ਼ੀਰੋ ਜਾਂ ਪਿਛਲੀ ਵਸਤੂ ਦਾ ਇੱਕ ਸਮਾਂ |
+ | ਪਿਛਲੀ ਵਸਤੂ ਦਾ ਇੱਕ ਜਾਂ ਵਧੇਰੇ ਵਾਰ |
| | ਓਆਰ ਓਪਰੇਟਰ |
[ਏਬੀਸੀ] | ਏ ਜਾਂ ਬੀ ਜਾਂ ਸੀ (ਅੱਖਰਾਂ ਦੀ ਗਿਣਤੀ ਹੋ ਸਕਦੀ ਹੈ) |
[ਅਜ਼] | ਇੱਕ ਤੋਂ z ਦੀ ਸੀਮਾ (ਅੱਖਰਾਂ ਦੀ ਗਿਣਤੀ ਹੋ ਸਕਦੀ ਹੈ) |
[AZ] | ਏ ਤੋਂ ਜ਼ੈੱਡ ਦੀ ਰੇਂਜ (ਪੂੰਜੀਕਰਣ) |
[0-9] | 0 ਤੋਂ 9 ਦੀ ਰੇਂਜ (ਕੋਈ ਵੀ ਗਿਣਤੀ ਹੋ ਸਕਦੀ ਹੈ) |
[a-zA-Z] | A ਤੋਂ Z ਜਾਂ A ਤੋਂ Z ਤੱਕ ਦੀ ਸੀਮਾ |
[a-zA-Z0-9] | ਸਾਰੇ ਅੱਖਰ ਅੱਖਰ |
1 {} | ਬਿਲਕੁਲ 1 ਉਦਾਹਰਣ (ਕੋਈ ਵੀ ਨੰਬਰ ਹੋ ਸਕਦੀ ਹੈ) |
{1-4 | 1 ਤੋਂ 4 ਉਦਾਹਰਣਾਂ ਦੀ ਰੇਂਜ (ਕੋਈ ਵੀ ਗਿਣਤੀ ਹੋ ਸਕਦੀ ਹੈ) |
{1, | 1 ਜਾਂ ਵਧੇਰੇ ਉਦਾਹਰਣਾਂ (ਕੋਈ ਵੀ ਨੰਬਰ ਹੋ ਸਕਦੇ ਹਨ) |
() | ਆਪਣੇ ਨਿਯਮਾਂ ਦਾ ਸਮੂਹ ਬਣਾਓ |
\ | ਵਿਸ਼ੇਸ਼ ਅੱਖਰ ਬਚੋ |
\d | ਅੰਕ ਅੱਖਰ |
\D | ਗੈਰ-ਅੰਕ ਅੱਖਰ |
\s | ਚਿੱਟੀ ਜਗ੍ਹਾ |
\S | ਗੈਰ-ਚਿੱਟੀ ਜਗ੍ਹਾ |
\w | ਬਚਨ |
\W | ਗੈਰ-ਸ਼ਬਦ (ਵਿਸ਼ਰਾਮ ਚਿੰਨ੍ਹ) |
ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਰੀਜੈਕਸ ਉਦਾਹਰਣ
ਇਸ ਲਈ ਆਓ ਕੁਝ ਲਈ ਕੁਝ ਉਦਾਹਰਣਾਂ ਦੇਈਏ ਕਸਟਮ ਫਿਲਟਰ. ਦੇ ਮਾਰਗ ਦੇ ਨਾਲ ਇੱਕ ਅੰਦਰੂਨੀ ਪੰਨੇ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਮੇਰੇ ਇੱਕ ਸਾਥੀ ਨੇ ਮੈਨੂੰ ਸਹਾਇਤਾ ਲਈ ਕਿਹਾ / ਇੰਡੈਕਸ ਉਹਨਾਂ ਸਾਰੀਆਂ ਬਲਾੱਗ ਪੋਸਟਾਂ ਤੋਂ ਇਲਾਵਾ ਜੋ ਪਰਮਲਿੰਕ ਵਿੱਚ ਸਾਲ ਦੇ ਨਾਲ ਲਿਖੀਆਂ ਗਈਆਂ ਸਨ:
ਫਿਲਟਰ ਫੀਲਡ ਬੇਨਤੀ url ਲਈ ਮੇਰਾ ਕਸਟਮ ਫਿਲਟਰ ਪੈਟਰਨ:
^/(index|[0-9]{4}\/)
ਇਹ ਅਸਲ ਵਿੱਚ / ਇੰਡੈਕਸ ਜਾਂ ਕੋਈ 4-ਅੰਕੀ ਸੰਖਿਆਤਮਿਕ ਮਾਰਗ ਲੱਭਣ ਲਈ ਕਹਿੰਦਾ ਹੈ ਜੋ ਇੱਕ ਪਿਛਲੀ ਸਲੈਸ਼ ਨਾਲ ਖਤਮ ਹੁੰਦਾ ਹੈ. ਮੈਂ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਇੱਕ ਦ੍ਰਿਸ਼ ਬਣਾਇਆ ਅਤੇ ਇਸਨੂੰ ਫਿਲਟਰ ਦੇ ਰੂਪ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ:
ਇੱਥੇ ਕੁਝ ਹੋਰ ਉਦਾਹਰਣ ਹਨ:
- ਤੁਹਾਡੇ ਕੋਲ ਯੂਆਰਐਲ ਪਰਾਮਲਿੰਕ ਮਾਰਗ ਵਿੱਚ ਸਾਲ ਦੇ ਨਾਲ ਇੱਕ ਬਲੌਗ ਹੈ ਅਤੇ ਤੁਸੀਂ ਸੂਚੀ ਨੂੰ ਕਿਸੇ ਵੀ ਸਾਲ ਲਈ ਫਿਲਟਰ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ. ਇਸ ਲਈ ਮੈਂ ਕੋਈ 4 ਅੰਕੀ ਅੰਕ ਚਾਹੁੰਦਾ ਹਾਂ, ਜਿਸ ਤੋਂ ਬਾਅਦ ਪਿਛਲੀ ਸਲੈਸ਼ ਹੋਏ. ਬੇਨਤੀ URl ਫਿਲਟਰ ਪੈਟਰਨ:
^/[0-9]{4}\/
- ਤੁਸੀਂ ਆਪਣੇ ਸਾਰੇ ਪੰਨਿਆਂ ਦੀ ਤੁਲਨਾ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਜਿੱਥੇ ਸਿਰਲੇਖ ਹੈ ਸਰਟੀਫਿਕੇਟ or ਸਰਟੀਫਿਕੇਸ਼ਨ ਇਸ ਵਿੱਚ. ਪੰਨਾ ਸਿਰਲੇਖ ਫਿਲਟਰ ਪੈਟਰਨ:
(.*)certificat(.*)
- ਤੁਸੀਂ ਦੋ ਲੈਂਡਿੰਗ ਪੇਜਾਂ ਦੀ ਤੁਲਨਾ ਉਨ੍ਹਾਂ ਦੇ ਮੁਹਿੰਮ ਮਾਧਿਅਮ ਦੇ ਅਧਾਰ ਤੇ ਦੇ ਵਿੱਚ ਕੀਤੀ ਸੀ ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ ਮੁਹਿੰਮ ਦਾ URL ਜਿਵੇਂ ਕਿ utm_medium = ਸਿੱਧੀ ਮੇਲ or ਭੁਗਤਾਨ ਕੀਤੀ ਖੋਜ.
(direct\smail|paid\ssearch)
- ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਸਾਰੇ ਉਤਪਾਦਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਜੋ ਯੂਆਰਐਲ ਮਾਰਗ ਦੇ ਅਧਾਰ ਤੇ ਪੁਰਸ਼ਾਂ ਦੀਆਂ ਕਮੀਜ਼ ਹਨ. ਬੇਨਤੀ URl ਫਿਲਟਰ ਪੈਟਰਨ:
^/mens/shirt/(.*)
- ਤੁਸੀਂ URL ਦੇ ਮਾਰਗ ਦੇ ਸਾਰੇ ਪੰਨਿਆਂ ਦੀ ਤੁਲਨਾ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਜੋ ਗਿਣਤੀ ਦੇ ਨਾਲ ਖਤਮ ਹੁੰਦਾ ਹੈ. ਬੇਨਤੀ URl ਫਿਲਟਰ ਪੈਟਰਨ:
^/page/[1-9]*/$
- ਤੁਸੀਂ IP ਐਡਰੈੱਸ ਦੀ ਇੱਕ ਸੀਮਾ ਨੂੰ ਬਾਹਰ ਕੱ wantਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਆਈ ਪੀ ਐਡਰੈਸ ਫਿਲਟਰ ਪੈਟਰਨ ਨੂੰ ਬਾਹਰ ਕੱ .ੋ:
123\.456\.789\.[0-9]
- ਤੁਸੀਂ ਇੱਕ ਥੈਂਕਯੋ.ਐਚਟੀਐਮਐਲ ਪੇਜ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਜਿੱਥੇ ਕਿ ਬੇਨਤੀ ਸਫਲਤਾ ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਬੇਨਤੀ ਸਫਲ ਰਹੀ ਸੀ = ਸੱਚ. ਬੇਨਤੀ URl ਫਿਲਟਰ ਪੈਟਰਨ:
thankyou\.html\?success=true
ਆਪਣੇ Regex ਸਮੀਕਰਨ ਦੀ ਪਰਖ ਕਰਨ ਲਈ ਕਿਸ
ਗੂਗਲ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਅੰਦਰ ਅਜ਼ਮਾਇਸ਼ ਅਤੇ ਅਸ਼ੁੱਧੀ ਦੀ ਬਜਾਏ, ਮੈਂ ਅਕਸਰ ਇਸ 'ਤੇ ਛਾਲ ਮਾਰਦਾ ਹਾਂ regex101, ਤੁਹਾਡੇ ਨਿਯਮਤ ਸਮੀਕਰਨ ਨੂੰ ਪਰਖਣ ਲਈ ਇੱਕ ਸ਼ਾਨਦਾਰ ਉਪਕਰਣ. ਇਹ ਤੁਹਾਡੇ ਲਈ ਤੁਹਾਡੇ ਸੰਟੈਕਸ ਨੂੰ ਵੀ ਤੋੜਦਾ ਹੈ ਅਤੇ ਤੁਹਾਡੇ ਨਿਯਮਤ ਸਮੀਕਰਨ ਦੇ ਵੇਰਵੇ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ: