Data Mining (5104730, 5104716, 5104737)

21
PROJECT DEVELOPERS Angad Singh, B-9 (05104730) Pulkit Arora, B-9 (05104716) Sushant Kaura, B-9 (05104737)

description

 

Transcript of Data Mining (5104730, 5104716, 5104737)

Page 1: Data Mining (5104730, 5104716, 5104737)

������������ �������������������������� �� ������

��

PROJECT DEVELOPERS Angad Singh, B-9 (05104730) Pulkit Arora, B-9 (05104716)

Sushant Kaura, B-9 (05104737)

Page 2: Data Mining (5104730, 5104716, 5104737)

�������

���������������� �� ����� ��������������������� ����������������� ���������� ����

� ����������������� ��������� ����� ���� ���������������� ����� ��� � �������

������ �������������������������������� �� ������� � � ������������ ������ �� ���

������������ ����� ������� ���! ������ ! ���� ��������� ����� �� ������ ! �� ������"� ! ���

����������� ��������� ����� �#��! ������������������������ ���

�����������

$ �������������� ���������������������� ���������� ���������������� �����������������

� �������� ��������������� ��������% ������ ������������ ��� �������� � ���������

���� ������������ ����������� �����������������&����� �������'�� �������� � �����

��(��������� ���������� ������! ����������� �����

���(�������������� ��� ����� ������ � ��������������������� �� �� ��� ����������

������������� ���� ���������������� �������������������(����������������������������� ���

���������������� ���� �������� ��� ������ ���� �� ����������� ��� ��� ������� �����

) �� ���(����������� ������������������� � ���������������� ��� ��� ��*���� �� �� ��

���������������� ��� ���� �� �� ����������������������������$ ������������������

+������������������������ ������ ������� ! ������ ������������� �������� ������ ���

�������,������������� ��-�� ���� ��� ������� ��������������� ���� ����� � ��������� ���. ���

����������� ���������� ��������� ��-�� ����! ����� �������������������� ��

������� ��� ������� � ����� ������������� ������������� ���� ��� ��������! ���� �����

����� ��! ������ �������� ! ������ �����������! ������������� ���� ������������� ���" ��

�������� ���� ��#� ���'� ������������� ���� �������������� ����� ������� �������������

��������� � ������ �������

%��������� ��� �������� � ��������! ��! ���� ��� � �������� �������� ���� ��� �������

������������� ��������������� �(����� ���� ��������������� �����! �� ���������� ��-�� ����

�� ���� ���������������� ����������� ��

����������������

$ �������������� ���� ����� �� �� ������� � ������ ��� �����(�! ����������������� � ������

���� �� ���������������� ������ ���������� � �������� �� �����. �������������� �������

�������� ����� �������������! ��������������%������������������������������ ��

��������� ������� ���������� ����(������ �������������� ����������������� ! (������

�� ������� ! ��� �� ������� ��������(� �! ������������� �����! ���� ����� ���������

���������� ������������ ���� � ���������� ������

������������� ������ ���� �� �����������'�� ����������������� ��� �� �������/��������

�� ������� ������������� �� ����� �������������� ����������������������(�������������

Page 3: Data Mining (5104730, 5104716, 5104737)

���� ����! ��� ������� ������ (������������� ��� � ����! ��� ��� � ������ ����'�� ����

! ����������������� � �����! �������� ��� ������ ������

. ����� ���� ������ ������������������ ��������� �����(�������������������� ��-�������'�

� ���� ��� ����� � � �� ����� ���� ���� � ����� ������ � � ��� ��� �� ������ ������ ������ � � ����

������� ������ ���� ���� �� ������������������� ����������� �� � ����(���������� �

���� �� (����������������� ���� ����� ��������� ����� ����� �����

����������������

�� ����������������� ��� ��

$ ���������� ����������������������! �����! ���������������� �(�����������'0�����

��������� �� !"(�+��������������� ��� #$�%"(�/����1 �� ��� (�/��������+������

2����� �� &$�'("(������+��������'������ ��� �� � ''"(�/��������1�� ����'������ ��

''"(����3�����2�����'������ �� ')"�� ���,������ ��/����&����� ����� ������������-���

��� �! ���� ��������������������������������! ��������������� ���$ ������������ �

����������������� ������ �� ������ ������������� �(����� ��������������� ���� �����

�������������� �� ���������������� ��� ����������������������'0�/����'�������� ����� �

��������������������� ���� ������������������ � !���"�� ������� � ��������#!"���"�

� ��������� ����� � �������� ������� ������ ������� ������� ���� ����� ��� ��������� ���

��������������� ��������� ���� ������������ ������ � ��� �� ���! ��� ��������

��������� �(�! �������������������� ������ ���� �! ����� � ������ ������ �������������

�� ���� ���� ����������������� �������� �������� ��� �(������� ���������� �(�

��� �����-�� �(��������� ���� ������(����� ������������� ������������ ��������� ���

���� ������������� ����������������� �(�� ������ ������������� ��� ��� ��� ���������� (�

���� �� ������� � ������������� ������� ���� ��������

��������� �������������$�%$� %������&����' ��( ����������� ��� ��� )�������� ����%��&�� )�

������ * ����� )��� ���+������,���� ��������������$�������������$�����' �����' � �

�� ������� ����� ��$���(���)������� ��������������%������ ���� ��������� ���%%� ' ��( �

)��������-���$��� ��' ��� ��$�%�.������%���� �������� ����� ����,�����$��������

Page 4: Data Mining (5104730, 5104716, 5104737)

�� ����� �* � ,��/��������$��

���+����) ���*�'������"+) '#������� ��� �� ���������������������������� �������������

����������! �����! ������������������������������ ��� ���� ������ ���������������

� ���� ��� ������� ����������� ����� �� � �������������� ����� ����� �"�� ���+) '�������

��� ���� ��� ����������� ������ ���� �"��� �����"�� � ��0 � *"��� � ������� ���� �-�� �(�

� ��! ����������������� ����� ����������������������������� ����� �� ���+) '���� ���

���������� �������������� ���� �������� � ��� ��� � �������� ��� �� ����������������(�

������������������ � �� ��������������-�� ���� ���� ������ ������������������� �������������

����� ! �� ��������� ������(��������������������� ���������! ���������������-���$ ����

����� �� � ������������� ��������������� �� ������� (�����+) '���������� �������

1� � �����$� �$�%�$%� ������( �

$ ���������! ����� �������� ����� ��"�� ��� ���(��������������� � �����������������"14%#�

������ � �"������� ���������"����� ��������������� ���� ��� ���#���������� ���(�����

� ���� ������������������ �����(���������� ���� �� ��������������������� �����������

��� ! �������������������������� ����/����� ���������� �������� �������������(������ ��� ��

������������� ��� ���� �������� ��� ������������������� �������(�������������� ���� ����

� ��� ������������! ��� �� ����������� ��� �������! �������2�5�6�! ����� ��� �����������2�

����������� �������������7� ����! ����

�� �������� ��%�$%� ������( �

8�� ��������� ����� ������������ �������������� ��������� ��������� ����������! ������

������������������� �������������� ������� ������ ��� ������������ ���(���������� ���

����������������� ���������������������������������������������������� �������� ���

�� ��� ��8�� ������������� �� ���� �-�������������������������

��������� ��8�� ���������������������� ������������������� �� ������� ����+����! ����

������ ��������� ��(��������������������������� ������������������/ � ���� ������� ���� ��

������ ����������������� ����! ������������� ��� ���� �� (������������������������� ���

� ���� ��������� � � ��� �������������������������,���

Page 5: Data Mining (5104730, 5104716, 5104737)

+������� ������, ����������

4# �'�) ����9��������� ��

�� 4�� ���� �-��������� �� ��� �������� ���� ������ ����

��� /����������� ��������� ������ �����

&# /��������%��������� ���'�) ����

�� ������������������� ��� �������������������� ! ������������� ���� �����������(��������

���������� ���������(� ��� ��� ���� � � ��� ����� ���������� �� ���� � ���� ��� � ���

����� �� �����

��� �� � ����������� �������� ����������� �� ��

���� ������� �� ��� ���� ��� ����������� �������� ������������ ! ��� ���� ��� ����

�:� %������ �� ������������� ��� ���������������������������� �������� �����

:� ) ������� ������������� ��� ������������ ��������� �������� ������

:�� ��������) ����:��! ���� ���������������������� �����

%# ��

�� ) ����:��! ���� ��9����������������� ����"� �����������; �#�

��� '����) �����"�� � ��(�� ��(����� �(�������(����! (�� ����������(�����#�

���� /����'�������� ��%����� ��

�:� +) '�%����� ��

:� , ���������� ��

Page 6: Data Mining (5104730, 5104716, 5104737)

2� ! �����

�� � ����'�) ����

��������, ����

% � �����/����'������ ��

9����������������'������ ��

%�������+) '�! ������������ �� ������������

������� ��

4�����%���������4�� ����� �

���� ����������������

�������

Page 7: Data Mining (5104730, 5104716, 5104737)

. ���4��� ���

. ���� �� ��� ��������� ����������'� ������ �������� ����������$ �� ������ � ��'���� ������ ����

������� � �� ���� ���������� �� �� ������� ���� �� ������ ��� ! �� ����� �� � ������� � ! ����� ����� �� ������

�����! ���� ����� �������� ����������������������� ������ ������� ����������� ������������������������

��������������� ������ ���� ������������������� � �����! ����� ����������� ��� ����������� ��! �������

� ����� � �� ���� ������������ �������������'�� ������ ����� ���������� ����� ���(������ ��� ��� ������

�� ���� � ������(�� ����������(�������� �(������ �������������! �����! �� ���� �� ������������ ������� ����

����������������� ��������� ������$ ������������������������������ ��� ������������� �������� � �������

! ������ ���������������

����'������ ������� ����� �������� ��������� �� ! ��������

# , ����������� ���

�# % � ����� �� ������������� ���

�# %������ ��� ��+) '�

�# %��������� ��4���) �����������'����

/����7�������������� ���� �������������� ������� ������� �� ��������� � ����/����0����-������� ���� ��

����� ������� � �������������������� �� ������� ����/�������������%������� ������ �����*��� ����� �

������������������ ������� ��������� ��� ��� ������������������������� ��� ��� ���(��������<����� �� �����

������������ �����������������+) '� ����������������������� ������ � ��� ��! ������������������� �� ������

� ����������������� ��������������������� ���� ������� ���� ������������������� ����������������

������������ ���������� ����� ���� ����� ��

Triangulated Model Point Set D2 DistributionTriangulated Model Point Set D2 Distribution

Page 8: Data Mining (5104730, 5104716, 5104737)

(a) Generation of Points

4��'�� ���� ���� ����������� ���� ��������������� ������������

���� �� ���� ��� ���� ������������ ������� ���

��������� � ��������� ������ � ��� ���� �������� ��������

� ����

����5"��.��.�1#�����������(�������� ���

���/5=��.3 .�4>���������������� ���(�������� ��

ALGORITHM:

������������� � �� ����� ���?��

7� %� �����������2�! ���������� ����� ������� ��

0� 9�� � ����� ���� ��������2

T =

Triangle Model

4��'�� ���� ���� ����������� ���� ��������������� ������������� ����. ���� ����� ������������� � �����

���� �� ���� ��� ���� ������������ ������� ���� 4���������� ����!"�#� 0 �5����� � !������������� �������� ���� ����

���� ������ � ��� ���� �������� ������������� ����

���������� ?�

>���������������� ���(�������� ������������ ������� � ��������� ����������

! ���������� ����� ������� ���

2��

( ) ( )2

1312 pppp −×−=

Point Set (n=100) Point Set (n=1000)

� ����. ���� ����� ������������� � �����

��������� �������� ���� ����

=1000)

Page 9: Data Mining (5104730, 5104716, 5104737)

��������������� ���������������2�����25"�

������������ � �� ����������������� ��� ���������� ��������

��� ����� ��������

������������� � �� ����������������� ��� (����������! ���� � ���� ����

/������ ��������� ���?�

����@��A7������ ����! ����� ������������ ��������������(��������

TIME COMPLEXITY ANALYSIS:

Let

d = Density of point generation

f = Number of faces in the mesh

n = Number of points to generate

A(f) = Total Area of the mesh (sum of area of all faces)

Step 1: n = d * A(f)

Number of iterations = f

Step 2: generate all points

Number of iterations = n

Time Complexity = O (f + n) = O(n)

),( ts →

1 spp +=

��.��.�1#������������������� ��� �"��.��.�1���6�1+��#��

������ ��� ���������� ������������� ����������������������(� ����! ���������������

������������� � �� ����������������� ��� (����������! ���� � ���� ��������������������������B6(7C�

������� ��������������(������������������?��

d = Density of point generation

f = Number of faces in the mesh

of points to generate

A(f) = Total Area of the mesh (sum of area of all faces)

)1,1( ts −−→

)()( 1312 pptpp −+−

����! ���������������

���������������B6(7C��

Page 10: Data Mining (5104730, 5104716, 5104737)

D2Model distance

prob

abi li

t y

D2Model distance

prob

abi li

t y

FLOWCHART

(b) Calculation of Shape Distribution

�2 ������ ��� �����(�������������(���������� ������'������ ������ ��������� ���� ��� ��������! � ������

! �������������?�

{ }2

s.t. ,)(D

P

dqpPqpdP

=−∈=

%�������� ������ ���� ��� ����� �������������

���������� ��������

%���������� ���� ��� ����� �������������� ����������

����������� � �� ���� ����������

Page 11: Data Mining (5104730, 5104716, 5104737)

P

• %. D%�/+� . �/ .9+(��

• �D:49�4D � . � 94D/2.9

• +22�%�+D � . �) 4 %1

• �D/+D/� �:+� . �D. �/+

• �D/+D/� �:+� . � .,. 3.

• 9. &;/ � . �'+�+D+94%�+

512 bytes (64 values)

0.5 seconds (106

��������

����� ���

���������

512 bytes (64 values)

0.5 seconds (106

��������

����� ���

���������

�Translation�Rotation�Mirror

Normalized Means

�Scale (w/ normalization)

���������

�Translation�Rotation�Mirror

Normalized Means

�Scale (w/ normalization)

������������������

��������

����� ���

���������

�����

��������

����� ���

���������

�����

PROPERTIES OF A SHAPE DESCRIPTOR

��E; �%8� . �%. ) ,; +�

D:49�4D � . � 94D/2.9) /�

22�%�+D � . �) 4 %1 �

D/+D/� �:+� . �D. �/+�

D/+D/� �:+� . � .,. 3.�F�

. &;/ � . �'+�+D+94%�+/�

512 bytes (64 values)6 samples)

��������

���������

512 bytes (64 values)6 samples)

��������

���������

Normalized Means

Scale (w/ normalization)

�����

Normalized Means

Scale (w/ normalization)

����������

������������������

Page 12: Data Mining (5104730, 5104716, 5104737)

• '�/%9�) �D4 �D��

�)����������������������'!������������������

Line Segment Circle

Cylinder Cube

Sphere Two Spheres

Line Segment Circle

Cylinder Cube

Sphere Two Spheres

�)����������������������'!�������������������

Two SpheresTwo Spheres

Page 13: Data Mining (5104730, 5104716, 5104737)

ALGORITHM:

�+ '+/%9�, .9"�.�.�.��.�#�

$�←6�

2.9��5�� . ���

��B�C�←�7��

2.9��5�� . ���

2.9�85�� . ����

�←GG��+�8GG�

�2�"�H�#�

��B�"���#I��C�←���B�"���#I��C�@�7�

$�←�$�@�7�

0%

50%

100%

0% 50% 100%Recall

Pre

cisi

on

Gaussian EDTD2Random

�- ��������������)�����������������. ���/��������0�1�

Page 14: Data Mining (5104730, 5104716, 5104737)

2.9��5�� . ���

��B�C�←���B�C�$�

TIME COMPLEXITY ANALYSIS

Let N = number of points Step 1: Calculate maximum distance between any point-pair Number of iterations = N (N – 1)/2 Step 2: Iterate through all the point-pair distances and add to descriptor Number of iterations = N (N – 1)/2 Time Complexity = O ( N (N – 1) ) / 2 + N ( N – 1 ) / 2 ) = O (N2) (Note: At stage 3, shape ambiguity was checked by finding out if mesh exists between the point-pair being added and thust complexity becomes O (N3) if “Check Shape Ambiguity” setting is turned on by the user)

FLOWCHART

(c) Earth Mover’s Distance

Treat one distribution as hills, the other as valleys and find the minimum amount of work needed to be done to move

earth from the hills to the valleys to flatten things out.

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

-100%

-80%

-60%

-40%

-20%

0%

20%

40%

60%

80%

100%

0 % 1 0 % 2 0 % 3 0 % 4 0 % 5 0 % 6 0 % 7 0 % 8 0 % 9 0 % 1 0 0 %

%�������� ��� �� �����������! ����� ��������

���������� �������� ��������� ��������������� �

������� ��

Page 15: Data Mining (5104730, 5104716, 5104737)

Approach: Instead of comparing the values in each bin, compute the amount of work needed to transform on

distribution into the other.

Define the cost of moving d values from bin to

Find the minimal amount of work that needs to be done to transform one distribution into the other.

Challenge: Given distributions X={x1,…,x

subject to the constraints:

ALGORITHM:

In general, this is the transportation problem[6]

For 1D histograms, this can be solved using the greedy algorithm.

• Find the first non-empty bin.

• Move earth into first non-empty bin in the other histogram.

jid ),,(Work

� �= =

n

i

n

jijij cf

1 1

��=

=i

n

jiij xf

1

and

0≥ijf

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60%

.1x3

Work=0

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40%

.1x4

Approach: Instead of comparing the values in each bin, compute the amount of work needed to transform on

values from bin to i to bin j as:

Find the minimal amount of work that needs to be done to transform one distribution into the other.

,…,xn} and Y={y1,…,yn}, set cij=|i-j| and find the values for f

transportation problem[6] and can be solved using linear programming.

For 1D histograms, this can be solved using the greedy algorithm.

empty bin in the other histogram.

jid −⋅=)

�=

=n

ijij yf

1

60% 70% 80% 90% 100%

Work=0

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

0%

20%

40%

60%

80%

100%

0% 10% 20% 30%

40% 50% 60% 70% 80% 90% 100%

Work=0.3

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%0%

20%

40%

60%

80%

100%

0% 10% 20% 30%

Approach: Instead of comparing the values in each bin, compute the amount of work needed to transform on

Find the minimal amount of work that needs to be done to transform one distribution into the other.

| and find the values for fij that minimize:

30% 40% 50% 60% 70% 80% 90% 100%

Work=0.3

30% 40% 50% 60% 70% 80% 90% 100%

Work=0.7

Page 16: Data Mining (5104730, 5104716, 5104737)

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=0.7

.1x3

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=1.0

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=1.0

.2x4

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=1.8

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=1.8

.5x3

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

0%

20%

40%

60%

80%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Work=3.3

Page 17: Data Mining (5104730, 5104716, 5104737)

"�#�%��������� �����) �����������'����

. ����� ����� (�,4/��(�� �� ! ������ � �������������������� ��(����������(��������! ������������������� ����

������� ���������� ���������������(�� �� ! ����! ��������� � ����� �� ������������� �����! ������������ �

�������� ������������������! ��������� ���(���������� ����� ��� �������������� ���� ����� ����� �����

� ������������������ ����������(�� ���! ����� ����! �������������� ������ ����"! ������������ ��#��������

�� � �������� ��� ���(���������� �������������� ����� ������� ���������������� ����� �������������

��������������������������� ����! ���������� ����� ���������� �������� ���(��� ���� ����"����������������

��������������� ����������������#�� ���� ��������� ����������������! ������������� ������ �� ����! ���������

ALGORITHM:

1. %����������� ��/������) ����%�����

2. % � �������������� ����� �������������

3. ���������� �������������������� ����� ����������� ����(������������ ! (����������� ���� �����������

� ����������������(�� ���! �������������������� ���������������"! ��������������������� ��#��

4. ) ��������������� ����� ������� ���������������������� ���! ������������

J� 9�� ��� ��9��������������! ������������?�

$ ������������������������������������� �������� ����� �� ������������ ������ ������������ �����

������������������ ������������������ �(�! ��� �������������� ������������������������$ ��� �

��� �� ! ?�

�� ���������� ����������! �������������������������� ���������� ���(�������� ������������ ��

���������������������������������� ������

� /� ����������������� ������������ � ��������������������� ��������������

� ���������� ������������ ������������ ������������������ �� ! ��������������� ������ ���

! ����� �������� ��������������?�

�� 2��������� ��� �� �������� ���� ���������� ! ���������

��� 2��������� ���� �� � ���������� ��� �� ������������������ ������������������

� �����

���� ������������� ����! ��������0 �"�0 !0 �0 �9�0 !0 ������������

Page 18: Data Mining (5104730, 5104716, 5104737)

K� 9���������� ����� ������������������ ���! ���������������"��������� �� ���� ���� ����� ����! ������

����������������� ��#�

L� '�������������������������

FLOWCHART:

%������������ ���������������

% � �����4��������) ����

,� ���4����) ��������%�����D �! �%������'���

9�� ���9��������� ��) ���

9������������ ���! ��������������

'�����9����

Page 19: Data Mining (5104730, 5104716, 5104737)

� �����- ���������

Stage 1

Initially the shape descriptors were calculated using only the vertices extracted from the models in their

source format. This approach threw up incorrect search results since the vertices are unable to describe

the shape of a given model accurately, leading to ambiguous shape descriptors. Therefore this approach

for the calculation of shape descriptors was discarded for a more accurate approach.

Stage 2

The shape descriptors are dependent on the distances between the points and thus the approach of

stage 1 was flawed. Hence, a modified approach was adopted and points were populated on the surface

of the model, and the shape descriptor calculated using the generated points and not the vertices of the

models.

Stage 3

Until now, all the calculations with the points extracted obtained by parsing the source file format. This

was an inefficient approach and turned out to be the main performance bottleneck. Thus, instead of

extracting the points from the source format itself, the model file was converted to a more efficient format

for our purpose called the Object File Format (off). Although the point extraction got a significant

performance boost (almost twice as fast), the rendering using the new format was painstakingly slow.

Thus to achieve optimum performance for both operations, we had to maintain both files in the model

database. Thus a trade-off was made between memory and processing, the odds being in the favor of

processing. Consequently, this approach was adopted since the memory overhead was minimal

compared to the performance gain.

Stage 4

Even after making the aforementioned modifications, the search still threw up certain incorrect results due

to a fundamental flaw in the shape descriptor calculation algorithm which calculated and added to the

descriptor, even the distances between pairs of points which were not connected by the mesh. To correct

Page 20: Data Mining (5104730, 5104716, 5104737)

this flaw, the shape descriptor algorithm was modified to check if the mesh existed between the pairs of

points being considered in the descriptor.

Stage 5

After successfully implementing a novel shape matching algorithm, we moved on to the final goal of the

project – to be able to cluster the 3d models in the database using a novel shape-similarity matching

algorithm. We formulated our own robust algorithm which takes inspiration from existing clustering

algorithms like K-Means Clustering and Nearest Neighbor clustering. We have devised an agglomerative

algorithm which initially starts with as many clusters as there are models and then iteratively merges

those single-model clusters into combinations of two or more models. We are argue that our algorithm is

unique as it even finds and removes redundancy in clusters.

���������� ������������

����� � ������� ��� ������ � ��� � � �����! ��������������������� ������������ �� ���� ��� 4��������

� � � ����������������� ������������������������� ���������������� ��� ���'������������?�

• 3D Model Clustering Engine

• 3D Model Search Engine

• Model Viewer for Rendering the 3d model (rotate and scale UI)

• Database Manager (import, move, rename, delete, view, manage categories)

• Shape Distribution Calculator

• EMD Calculator

• Point Generator

Most of the underlying libraries and classes can be reused for designing various 3D applications, some of them include:

• Searching of a given 3D model in a virtual 3D environment. • Applications to help in reconstruction of Archeological sites. • An intuitive and easy to use HCI, such as hand gesture recognition.

• 3����������� �������������� ����

• Tool for manipulating and developing 3D objects

Page 21: Data Mining (5104730, 5104716, 5104737)

�����������

[1] R. Osada, T. Funkhouser, B. Chazelle, and D. Dobkin. Matching 3D models with shape

distributions. In Proc. Shape Modeling International, pages 154{166, Genova, Italy, May

2001. IEEE Press.

[2] Seminar on Shape Analysis and Retrieval (600.658), D2 Shape Distributions, http://www.cs.jhu.edu/%7Emisha/Fall04/09-14-04.ppt

[3] Yossi Rubner, Carlo Tomasi, and Leonidas J. Guibas, Computer Science Department, Stanford University, A Metric for Distributions with Applications to Image Databases

[4] P.Min, J. Halderman, M. Kazhdan, and T. Funkhouser. Early experiences with a 3D model search engine. In Proceeding of the eighth international conference on 3D web technology, pages 7–18, 2003.

[5] Philip Shilane, Patrick Min, Michael Kazhdan, and Thomas Funkhouser, Department of Computer Science, Princeton University, The Princeton Shape Benchmark

[6] G. B. Dantzig. Application of the simplexmethod to a transportation problem. In Activity Analysis of Production and Allocation, 359–373. JohnWiley and Sons, 1951.

[7] B. Horn. Extended Gaussian images. Proc. of the IEEE, 72(12):1671–1686, December 1984.

[8] S. Kang and K. Ikeuchi. Determining 3-D object pose using the complex extended Gaussian image. In CVPR, pages 580–585, June 1991.

[9] D. Saupe and D. V. Vranic. 3D model retrieval with spherical harmonics and moments. In B. Radig and S. Florczyk, editors, DAGM 2001, pages 392–397, September 2001.

[10] D. V. Vranic. An improvement of rotation invariant 3D shape descriptor based on functions on concentric spheres. In IEEE International Conference on Image Processing (ICIP 2003), volume 3, pages 757–760, September 2003.

[11] M. Kazhdan, T. Funkhouser, and S. Rusinkiewicz. Rotation invariant spherical harmonic representation of 3D shape descriptors. In Symposium on Geometry Processing, June 2003. D.-Y.

[12] Chen,M. Ouhyoung, X.-P. Tian, and Y.-T. Shen. On visual similarity based 3D model retrieval. Computer Graphics Forum, pages 223–232, 2003.

[13] Princeton Shape Benchmark, http://shape.cs.princeton.edu/benchmark.

[14] A. K. Jain and R. C. Dubes, Algorithms for Clustering Data, Prentice-Hall, 1988.

[15] Ao Feng et al, Document Clustering - an Optimization Problem, SIGIR 2007 Proceedings.

[16] Pelleg, D., Moore, A.: X-means: Extending k-means with efficient estimation of the number of clusters. In: International Conference on Machine Learning. (2000) 727–734.