WIP on typechecking case statements
[scheme.git] / ast.scm
1 (load "utils.scm")
2
3 (define (ast-type x)
4   (define (builtin? x)
5     (case x
6       ('+ #t)
7       ('- #t)
8       ('* #t)
9       ('! #t)
10       ('= #t)
11       ('bool->int #t)
12       ('print #t)
13       (else #f)))
14   (cond
15    ((list? x)
16     (case (car x)
17       ('if 'if)
18       ('let 'let)
19       ('lambda 'lambda)
20       ('case 'case)
21       ('closure 'closure) ; only available in codegen
22       ('static-string 'static-string) ; only available in codegen
23       ('stack 'stack) ; only available in codegen (tag that value is passed via stack)
24       (else 'app)))
25    ((builtin? x) 'builtin)
26    ((symbol? x) 'var)
27    ((integer? x) 'int-literal)
28    ((boolean? x) 'bool-literal)
29    ((string? x) 'string-literal)))
30
31 (define (ast-traverse f x)
32   (case (ast-type x)
33     ('let `(let ,(map (lambda (x) (list (car x) (f (cadr x))))
34                       (let-bindings x))
35              ,@(map f (let-body x))))
36     ('app (map f x))
37     ('lambda `(lambda ,(lambda-args x) ,(f (lambda-body x))))
38     ('if `(if ,@(map f (cdr x))))
39     ('case `(case ,(f (case-expr x))
40               ,@(map (lambda (x)
41                        (list (car x) (f (cadr x))))
42                      (case-cases x))))
43     ('stack `(stack ,(cadr x) ,(f (caddr x))))
44     (else x)))
45
46 (define (ast-collect f x)
47   (define (inner y) (ast-collect f y))
48   (case (ast-type x)
49     ['let (append (f x)
50                   (flat-map inner (let-bindings x))
51                   (flat-map inner (let-body x)))]
52     ['app (append (f x)
53                   (flat-map inner x))]
54     ['lambda (append (f x)
55                      (inner (lambda-body x)))]
56     ['if (append (f x)
57                  (flat-map inner (cdr x)))]
58     ['case (append (f x)
59                    (inner (case-expr x))
60                    (flat-map inner (map cadr (case-cases x))))]
61     ['stack (append (f x)
62                     (inner (caddr x)))]
63     [else (f x)]))
64
65 (define (ast-find p x)
66   (define (inner y) (ast-find p y))
67   (define (any p x) (fold-left
68                      (lambda (acc y) (if acc #t (p y)))
69                      #f
70                      x))
71   (define (either . fs)
72     (if (null? fs) #f
73         (if (car fs) (car fs)
74             (apply either (cdr fs)))))
75                      
76   (case (ast-type x)
77     ['let (either (p x)
78                   (any inner (let-bindings x))
79                   (any inner (let-body x)))]
80     ['app (either (p x)
81                   (any inner x))]
82     ['lambda (either (p x)
83                      (inner (lambda-body x)))]
84     ['if (either (p x) (any inner (cdr x)))]
85     ['stack (either (p x) (inner (caddr x)))]
86     [else (p x)]))
87
88 (define let-bindings cadr)
89 (define let-body cddr)
90
91 (define case-expr cadr)
92 (define case-cases cddr)
93
94                                         ; (let ([(foo a b) (foo 123 345)]) a)
95                                         ;   |
96                                         ;   v
97                                         ; (let ([a (foo~0 (foo 123 345)]
98                                         ;       [b (foo~1 (foo 123 345)]) a)
99 (define (expand-pattern-matches program)
100   (define (go x)
101     (define (pattern-match binding)
102       (let ([binding-name (car binding)]
103             [body (cadr binding)])
104         (if (eqv? (ast-type binding-name) 'var)
105             (list (list binding-name body))
106             
107             (let* ([sum-name (car binding-name)]
108                    [destructor (lambda (i) (dtor-name sum-name i))]
109                    [products (cdr binding-name)]
110
111                    [data-layouts (program-data-layouts program)]
112
113                    [type (data-tor-type data-layouts sum-name)]
114
115                    [sums (cdr (assoc type data-layouts))]
116                    [sum (assoc sum-name sums)]
117                    
118                    [expected-number (length (cdr sum))])
119
120                                         ; assert that we only do a let pattern match on an ADT with exactly one sum
121               (when (not (= 1 (length sums)))
122                 (error #f (format "Cannot pattern match a ~a in a let since it has ~a possible constructors"
123                                   type
124                                   (length sums))))
125
126                                         ; assert that there is the correct number of bindings
127               (when (not (= (length products)
128                             expected-number))
129                 (error #f (format "Got ~a bindings: expected ~a for ~a"
130                                (length products)
131                                expected-number
132                                binding)))
133               
134               (flat-map (lambda (y i)
135                           (pattern-match (list y `(,(destructor i) ,body))))
136                         products
137                         (range 0 (length products)))))))
138     (case (ast-type x)
139       ['let `(let ,(flat-map pattern-match (let-bindings x))
140                ,@(map go (let-body x)))]
141       [else (ast-traverse go x)]))
142   (program-map-exprs go program))
143
144 (define (lambda? x)
145   (and (list? x) (eq? (car x) 'lambda)))
146
147 (define (statement-type x)
148   (cond
149    [(and (list? x)
150          (eqv? (car x) 'data)) 'data]
151    [(and (list? x)
152          (eqv? (car x) 'define)) 'define]
153    [else 'expr]))
154
155
156                                         ; (A ((foo (Int Bool))
157                                         ;     (bar (Bool)))
158 (define (program-data-layouts program)
159   (map (lambda (x) (cons (car x) (cdr x))) ; convert to assoc list
160        (map cdr (filter (lambda (x) (eqv? (statement-type x) 'data))
161                         program))))
162
163 (define (program-defines program)
164   (filter (lambda (x) (eqv? (statement-type x) 'defines))
165           program))
166
167 (define (program-map-exprs f program)
168   (map (lambda (x)
169          (case (statement-type x)
170            ['expr (f x)]
171            [else x]))
172        program))
173
174 (define (program-body program)
175   ; hack to have multi-expression bodies
176   `(let ()
177      ,@(filter (lambda (x) (eqv? (statement-type x) 'expr))
178                program)))
179
180 (define (data-tor-type data-layouts tor)
181   (let* ([tors (flat-map data-tors data-layouts)]
182          [info (cadr (assoc tor tors))])
183     (car info)))
184
185                                         ; a data tor is either a constructor or destructor for an ADT
186                                         ; data-tors returns constructors and destructors for a data-layout
187                                         ; (data A (foo Int Bool)
188                                         ;         (bar Bool))
189                                         ;        |
190                                         ;        v
191                                         ; (foo   . ((A foo constructor) . (abs Int (abs Bool A))))
192                                         ; (foo~0 . ((A foo 0 Int)       . (abs A Int)))
193                                         ; (foo~1 . ((A foo 1 Bool)      . (abs A Bool)))
194                                         ; (bar   . ((A bar constructor) . (abs Bool A)))
195                                         ; (bar~0 . ((A bar 0 Bool)      . (abs A Bool)))
196                                         ;  ------+-------------------------------------
197                                         ;  tor   | info                 | type
198
199 (define (data-tors data-layout)
200   (define (constructor-type t products)
201     (fold-right (lambda (x acc) `(abs ,x ,acc)) t products))
202
203   (define (destructor ctor-name prod-type part-type index)
204     (let* ([name (dtor-name ctor-name index)]
205            [info (list prod-type ctor-name index part-type)])
206       (cons name (cons info `(abs ,prod-type ,part-type)))))
207   
208   (let ([type-name (car data-layout)]
209         [ctors (cdr data-layout)])
210     (fold-right
211      (lambda (ctor acc)       
212        (let* ([ctor-name (car ctor)]
213               [products (cdr ctor)]
214               
215               [maker (cons ctor-name (cons (list type-name ctor-name 'constructor) (constructor-type type-name products)))]
216               
217               [dtors (map (lambda (t i) (destructor ctor-name type-name t i))
218                           products
219                           (range 0 (length products)))])
220          (cons maker (append dtors acc))))
221      '()
222      ctors)))
223
224                                         ; creates a type environment for a given adt definition
225 (define (data-tors-type-env data-layout)
226   (map (lambda (x) (cons (car x) (cddr x))) (data-tors data-layout)))
227
228 (define (dtor-name ctor-name index)
229   (string->symbol
230    (string-append (symbol->string ctor-name)
231                   "~"
232                   (number->string index))))
233
234 ; for use in normalized form
235 (define lambda-arg caadr)
236 ; for use elsewhere
237 (define lambda-args cadr)
238 (define lambda-body caddr)
239
240 (define (references prog)
241   (ast-collect
242    (lambda (x)
243      (case (ast-type x)
244        ['var (list x)]
245        [else '()]))
246    prog))
247
248 (define (graph bs)
249   (define (go bs orig-bs)
250     (if (null? bs)
251         '(() . ())
252         (let* [(bind (car bs))
253
254                (vert (car bind))
255                (refs (filter ; only count a reference if its a binding
256                       (lambda (x) (assoc x orig-bs))
257                       (references (cdr bind))))
258                (edges (map (lambda (x) (cons vert x))
259                            refs))
260
261                (rest (if (null? (cdr bs))
262                          (cons '() '())
263                          (go (cdr bs) orig-bs)))
264                (total-verts (cons vert (car rest)))
265                (total-edges (append edges (cdr rest)))]
266           (cons total-verts total-edges))))
267   (go bs bs))
268
269 (define (successors graph v)
270   (define (go v E)
271     (if (null? E)
272         '()
273         (if (eqv? v (caar E))
274             (cons (cdar E) (go v (cdr E)))
275             (go v (cdr E)))))
276   (go v (cdr graph)))
277
278                                         ; takes in a graph (pair of vertices, edges)
279                                         ; returns a list of strongly connected components
280
281                                         ; ((x y w) . ((x . y) (x . w) (w . x))
282
283                                         ; =>
284                                         ; .->x->y
285                                         ; |  |
286                                         ; |  v
287                                         ; .--w
288
289                                         ; ((x w) (y))
290
291                                         ; this uses tarjan's algorithm, to get reverse
292                                         ; topological sorting for free
293 (define (sccs graph)
294   
295   (let* ([indices (make-hash-table)]
296          [lowlinks (make-hash-table)]
297          [on-stack (make-hash-table)]
298          [current 0]
299          [stack '()]
300          [result '()])
301
302     (define (index v)
303       (get-hash-table indices v #f))
304     (define (lowlink v)
305       (get-hash-table lowlinks v #f))
306
307     (letrec
308         ([strong-connect
309           (lambda (v)
310             (begin
311               (put-hash-table! indices v current)
312               (put-hash-table! lowlinks v current)
313               (set! current (+ current 1))
314               (push! stack v)
315               (put-hash-table! on-stack v #t)
316
317               (for-each
318                (lambda (w)
319                  (if (not (hashtable-contains? indices w))
320                                         ; successor w has not been visited, recurse
321                      (begin
322                        (strong-connect w)
323                        (put-hash-table! lowlinks
324                                         v
325                                         (min (lowlink v) (lowlink w))))
326                                         ; successor w has been visited
327                      (when (get-hash-table on-stack w #f)
328                        (put-hash-table! lowlinks v (min (lowlink v) (index w))))))
329                (successors graph v))
330
331               (when (= (index v) (lowlink v))
332                 (let ([scc
333                        (let new-scc ()
334                          (let ([w (pop! stack)])
335                            (put-hash-table! on-stack w #f)
336                            (if (eqv? w v)
337                                (list w)
338                                (cons w (new-scc)))))])
339                   (set! result (cons scc result))))))])
340       (for-each
341        (lambda (v)
342          (when (not (hashtable-contains? indices v)) ; v.index == -1
343            (strong-connect v)))
344        (car graph)))
345     result))